Winkelmand

Geen producten in je winkelwagen.

DeepSeek legt bom onder big tech: zuinig AI-model uit China dwingt Silicon Valley tot herbezinning

Met verouderde Nvidia-chips bouwt de Chinese startup DeepSeek een AI-systeem dat bijna net zo goed presteert als ChatGPT, maar voor een fractie van de kosten en het energieverbruik. Silicon Valley is in shock, net als de rest van de wereld.

DeepSeek AI chatgpt concurrent open source
Foto: Getty Images

Een boycot kan niet voorkomen dat de technologische innovatie in China razendsnel gaat. Sterker nog: AI-startup DeepSeek legt een bom onder big tech in Amerika. Het piepjonge Chinese bedrijf veroorzaakt deze week een schokgolf in de wereld van kunstmatige intelligentie.

Nvidia verloor in een dag 600 miljard dollar van zijn beurswaarde. OpenAI, Google en andere bigtechbedrijven moeten uitleggen waarom ze zoveel geld pompen in hun AI-diensten en president Trump noemt het een wake-upcall. Wat is er aan de hand?

Terwijl grote spelers tientallen miljarden staken in de ontwikkeling van de AI-modellen die ChatGPT, Claude en Gemini aandrijven, beweert DeepSeek dat het voor een paar miljoen zijn nieuwste AI trainde. Desondanks werkt de software net zo goed of soms zelfs beter dan die van de gevestigde orde.

Veelbelovende nieuwkomer uit China

Belangrijker: DeepSeek gebruikt als het zijn opdrachten uitvoert ook vele malen minder rekenkracht, stelt het bedrijf. Van die besparing profiteren de gebruikers. Ze betalen maar een fractie van wat ze bij de Amerikaanse concurrenten gewend zijn.

Bovendien lijkt de Chinese nieuwkomer een enorm probleem op te lossen rond AI: het vreet energie. Volgens Goldman Sachs groeit de stroombehoefte van datacenters door AI met 160 procent tegen 2030.

Behalve voor de gevestigde AI-belangen klinkt het aanbod van DeepSeek too good to be true. Goedkope en zuinige AI, waarvan de code ook nog eens open source is zodat alle ontwikkelaars erop kunnen voortborduren? Daar zit de wereld op te wachten.

DeepSeek is inmiddels de populairste gratis app in de Amerikaanse App Store in een hype die doet denken aan de komst van ChatGPT in 2022. Maar is het werkelijk zo’n aardverschuiving?

Het verhaal achter DeepSeek

DeepSeek-oprichter Liang Wenfeng.

Even terug naar het begin. DeepSeek heeft geen Alibaba, Tencent of andere Chinees bigtechbedrijf achter zich. Oprichter Liang Wenfeng studeerde wel af als ingenieur aan de universiteit van Zhejiang, maar gebruikte zijn kennis van algoritmes de afgelopen jaren vooral voor het hedgefonds dat hij samen met twee studievrienden oprichtte, High-Flyer.

Dat groeide mede dankzij AI uit tot een miljardenbusiness en op een goed moment – nog voordat de techboycot door de Verenigde Staten dat onmogelijk maakte – kocht het grootschalig Nvidia-chips in, de motor achter zo’n beetje alle AI-systemen, om eigen supercomputers te bouwen.

Vanaf 2021 werden die duizenden processoren gebruikt voor een reeks projecten in de marge van High-Flyer, maar in 2023 groeide dat uit tot DeepSeek, in feite een verzameling talentvolle wetenschappers die zich samen met Wenfeng mochten uitleven met al die rekenkracht. Het heeft wel iets weg van OpenAI in de beginjaren.

‘We wilden gewoon AI betaalbaar en toegankelijk maken voor iedereen’, aldus Wenfeng vorig jaar in een interview met een Chinese techsite. ‘We hadden zelf niet verwacht dat dit zoveel impact zou hebben.’

Het geheim achter DeepSeeks succes

DeepSeek heeft met die 50.000 Nvidia-chips – van een verouderd type – nu een AI-systeem gebouwd dat kan concurreren met modellen waarvoor techgiganten als Meta vele malen meer chips nodig hebben. Die doorbraak, zo claimt het, zit in de architectuur waarmee het zijn modellen traint. MLA (Multi-head Latent Attention) is het gedoopt, een methode die slechts 5 à 13 procent van het geheugen gebruikt van ‘conventionele’ AI. Een idee van een van zijn jonge onderzoekers, aldus Wenfeng.

De techniek achter DeepSeek is tot nu toe niet overtuigend door experts onderuitgehaald, hoewel de software open source is en dus voor iedereen na te pluizen. Toch is er wel het een en ander op aan te merken.

Vaak gehoorde kritiek betreft de data waarmee het model is getraind: die zouden zijn gegenereerd door ChatGPT, waarmee de Chinezen dus meeliften op bestaande techniek, inclusief alle tekortkomingen daarvan. Er zijn echter wel meer AI-modellen die op zo’n manier worden getraind.

Verder valt gebruikers op dat de antwoorden die DeepSeek geeft verdacht veel lijken op die van OpenAI’s chatbot. Is de software dus een kopie of zijn de antwoorden gewoon de meest voor de hand liggende?

Prestaties in de praktijk: hoe goed is DeepSeek echt?

Over de prestaties die de DeepSeek-producten leveren, is meer overeenstemming. Vergelijkende tests wijzen uit dat ze de Amerikaanse orde grosso modo wel aankunnen. De app, een AI-assistent als tegenhanger van de algemene chatbot ChatGPT, doet het in de praktijk ongeveer net zo goed en maakt dus ook rare fouten. In het opstellen van langere teksten is de Chinese bot wel beroerd.

DeepSeek Coder, toegesneden op programmeren, verbaasde in juni al de AI-wereld en lijkt minstens zo goed als de laatste GPT-versies die mensen gebruiken om te coderen.

Vergelijkende test tussen DeepSeeks model en de taalmodellen van Amerikaanse concurrenten.

Het vorige week gelanceerde DeepSeek-R1, een systeem dat kan ‘redeneren’ en de denkstappen ook laat zien, is zelfs angstaanjagend goed. OpenAI-oprichter en ceo Sam Altman noemde R1 ‘een indrukwekkend model, vooral wat ze kunnen leveren voor die prijs’, hoewel hij eraan toevoegde dat OpenAI ‘vanzelfsprekend veel betere modellen’ zou gaan leveren in de toekomst.

Privacy en censuur

Een nadeel van de DeepSeek-AI is vooral dat het Chinees is. Als in: met lak aan de privacy van gebruikers of de bescherming van intellectueel eigendom. ‘Door inhoud te uploaden, publiceren of verzenden via de diensten van dit product, verleent u DeepSeek onherroepelijk een niet-exclusieve, geografisch onbeperkte, eeuwigdurende, royaltyvrije licentie om de betreffende inhoud te gebruiken en sublicenseren aan derden.’

Dat uploaden gebeurt vanzelfsprekend naar Chinese servers, onder toezicht van de plaatselijke overheid. Gebruikers die het vragen voerden over Taiwan of wat er in 1989 gebeurde op het Plein van de Hemelse Vrede in Beijing, kregen dan ook geen antwoord – of het werd onder hun ogen gewist. Dat ruikt naar censuur, ofwel een Chinese interpretatie van grenzen (rail guards) die ook westerse aanbieders hun taalmodellen meegeven.

Technologische wedloop tussen VS en China

En daarmee zijn we beland bij wat DeepSeek betekent voor de technologische strijd tussen VS en China. De Amerikaanse president Trump klonk maandag bijna redelijk toen hij daarover werd bevraagd.

Volgens hem is het goed dat AI nu goedkoper belooft te worden en moeten de Amerikaanse techbedrijven de les trekken dat hun dominantie niet vanzelfsprekend is. Om weer te vervallen tot de gebruikelijke Trumpismen: ‘Maar ze zullen winnen, want we hebben de beste bedrijven en de beste wetenschappers ter wereld.’

Het kan goed zijn dat Amerika ‘first’ is en blijft in AI, maar China loopt zijn achterstand in. In de overzichten van meest geciteerde wetenschappelijke AI-papers bruist het van de Chinese researchers. Het land telt er volgens sommige maatstaven inmiddels meer dan de VS. Doordat veel Chinese AI-software open source is, kunnen onderzoekers en ondernemers onbeperkt doorbouwen op bestaande technologie.

Impact op de mondiale AI-ontwikkeling

Maar de producten van DeepSeek, en eerder ook die van Alibaba, Tencent en Baidu, maken op dit moment de meeste indruk. Op onder anderen Eric Schmidt, de voormalige Google-ceo. Vorig jaar mei beweerde hij nog vol vertrouwen dat de VS een voorsprong had van twee tot drie jaar, ‘wat een eeuwigheid is wat mij betreft.’ In november noemde hij China’s AI-successen alweer ‘een schok’: ‘Ik dacht dat de beperkingen die we opleggen aan de export van chips hen zou tegenhouden.’

Niet dus. Meer geld en de snelste chips leiden niet automatisch tot snellere innovatie.

Als het succes van DeepSeek standhoudt, laat dat zien dat de Amerikaanse handelsbeperkingen op de geavanceerde chips van Nvidia – en de modernste machines van ASML – onbedoelde gevolgen kunnen hebben. In plaats van Chinese bedrijven af te remmen, dwingen ze ondernemers om creatiever en efficiënter te worden met de beschikbare middelen.