Het Chinese DeepSeek zegt dat het langverwachte nieuwe AI-model is uitgebracht
De Chinese startup DeepSeek heeft vrijdag een nieuw kunstmatige-intelligentiemodel uitgebracht, meer dan een jaar nadat het de wereld verbaasde met een goedkoop redeneermodel dat overeenkwam met de mogelijkheden van Amerikaanse rivalen.
klasse = “cf”>
DeepSeek-V4 “biedt een ultralange context van een miljoen woorden”, zei het bedrijf in een verklaring op het sociale mediaplatform WeChat en noemde het “kosteneffectief” in een aparte aankondiging op X.
De aankondiging kwam toen Meta zei dat het van plan was een tiende van zijn personeelsbestand te schrappen, omdat het op zoek was naar productiviteitswinsten ten opzichte van de rest van het personeelsbestand en tegelijkertijd zwaar zou investeren in kunstmatige intelligentie. Volgens berichten wilde Microsoft ook zijn gelederen verkleinen.
De contextlengte van DeepSeek-V4, die bepaalt hoeveel input een model kan absorberen om het te helpen taken te voltooien, “(behaalt) leiderschap op zowel nationaal als open-sourcegebied op het gebied van agentcapaciteiten, wereldkennis en redeneerprestaties”.
Een “preview-versie” van het open source-model is nu beschikbaar, aldus het bedrijf.
DeepSeek-V4 wordt uitgebracht als twee versies, DeepSeek-V4-Pro en DeepSeek-V4-Flash, waarbij de laatste “een efficiëntere en economischere keuze” is omdat deze kleinere parameters heeft.
klasse = “cf”>
V4-Pro heeft 1,6 biljoen parameters, terwijl de V4-Flash 284 miljard parameters heeft, die het besluitvormingsvermogen van modellen verfijnen.
Het model is ook “geoptimaliseerd” voor populaire AI Agent-producten zoals Claude Code, OpenClaw, OpenCode en CodeBuddy, aldus de verklaring.
“In wereldwijde kennisbenchmarks leidt DeepSeek-V4-Pro aanzienlijk andere open-sourcemodellen en presteert slechts lichtjes beter dan het topklasse closed-source-model, (Google’s) Gemini-Pro-3.1”, aldus de verklaring.
Het in Hangzhou gevestigde DeepSeek verscheen in januari vorig jaar op het toneel met een generatieve AI-chatbot, aangedreven door zijn R1-redeneringsmodel, dat de aannames van de Amerikaanse dominantie in de strategische sector op zijn kop zette.
Deze zogenaamde ‘DeepSeek-schok’ leidde tot een uitverkoop van AI-gerelateerde aandelen en een afrekening van de bedrijfsstrategie in wat ook wel werd omschreven als een ‘Spoetnik-moment’ voor de industrie.
De chatbot presteerde op een vergelijkbaar niveau als ChatGPT en andere Amerikaanse topaanbiedingen, maar het bedrijf zei dat er aanzienlijk minder rekenkracht nodig was om zich te ontwikkelen.
De plotselinge populariteit ervan riep echter vragen op over gegevensprivacy en censuur, waarbij de chatbot vaak weigerde vragen te beantwoorden over gevoelige onderwerpen zoals het harde optreden op het Tiananmen-plein in 1989.
klasse = “cf”>
Thuis worden de AI-tools van DeepSeek op grote schaal toegepast door Chinese gemeenten en zorginstellingen, maar ook door de financiële sector en andere bedrijven.
Dit is gedeeltelijk te danken aan de beslissing van DeepSeek om zijn systemen open source te maken, waarbij de innerlijke werking ervan openbaar wordt gemaakt – in tegenstelling tot de propriëtaire modellen die worden verkocht door OpenAI en andere westerse rivalen.
“Door China gemaakte grote AI-modellen hebben de ontwikkeling van het mondiale open-source AI-ecosysteem geleid”, vertelde de Chinese premier Li Qiang vorige maand op een jaarlijkse bijeenkomst van de beste besluitvormers van China.
klasse = “cf”>
De AI-race heeft de rivaliteit tussen China en de Verenigde Staten geïntensiveerd, en het Witte Huis beschuldigde donderdag Chinese entiteiten van een enorme poging om kunstmatige intelligentie-technologie te stelen.
“De VS hebben bewijs dat buitenlandse entiteiten, vooral in China, distillatiecampagnes op industriële schaal voeren om Amerikaanse AI te stelen”, zei wetenschaps- en technologiechef Michael Kratsios in een post op X.
“We zullen actie ondernemen om de Amerikaanse innovatie te beschermen.”
