AI Nieuws28 mei 2026Bijgewerkt 3 juli 20267 minGevorderd

DeepSeek verlaagt V4-Pro met 75%: impact op Nederland

DeepSeek maakte op 22 mei 2026 z'n 75%-korting permanent. V4-Pro draait nu op Chinese Huawei-chips en is 20x goedkoper dan GPT-5.5. Wat dit voor jou betekent.

doorRedactie · Redactieteam, Het Laatste AI Nieuws28 mei 2026

In één oogopslag

DeepSeek maakte op 22 mei 2026 zijn 75%-korting op het V4-Pro model permanent — input zakte van $1.74 naar $0.435 per miljoen tokens, output van $3.48 naar $0.87.
V4-Pro draait sinds deze release native op Huawei's Ascend 950-chips, waarmee DeepSeek het eerste Chinese frontier-model is dat volledig op binnenlands silicon werkt.
De nieuwe API-prijs ligt circa 20 tot 35 keer onder die van GPT-5.5 en Claude Opus 4.8, terwijl benchmarks van het 1,6 biljoen-parameter-model in de buurt blijven van de Westerse top.
Anthropic en Google bewegen technisch de andere kant op door tokenizers aan te passen — gebruikers genereren stilletjes 32-45% méér tokens voor dezelfde tekst en betalen daarmee effectief meer.
Voor Nederlandse bedrijven betekent dit een vrij dramatische verschuiving in kosten-per-experiment, maar ook nieuwe vragen rond data-soevereiniteit, EU AI Act-compliance en wie z'n logs uiteindelijk leest.

Op 22 mei 2026 kondigde het Chinese DeepSeek aan dat de 75%-korting op z’n vlaggenschipmodel V4-Pro, die officieel op 31 mei zou aflopen, permanent wordt. De nieuwe prijs voor de API is $0.435 per miljoen input-tokens en $0.87 per miljoen output-tokens — in de praktijk 20 tot 35 keer onder die van GPT-5.5 en Claude Opus 4.8. Wat daar onder ligt is interessanter dan de korting zelf. Het contrast is scherp: terwijl DeepSeek de prijs kelderde, legde Anthropic zich vast op 15 miljard dollar per jaar aan compute-kosten.

Beginner-tip:Een “token” is hoe AI-modellen tekst meten. Eén Nederlandstalig woord telt meestal als één tot drie tokens. Een offerte van 500 woorden eet ongeveer 1.000 tokens; een uitgebreid gesprek met een AI-assistent al snel 20.000-50.000. De prijs per miljoen tokens vertaalt dus naar honderden tot duizenden gesprekken.

De prijzen naast elkaar

Model	Input (per 1M tokens)	Output (per 1M tokens)
DeepSeek V4-Pro — nieuw (vanaf 22 mei 2026)	$0,435	$0,87
DeepSeek V4-Pro — oude prijs	$1,74	$3,48
GPT-5.5	15–25× duurder	~$25–$30
Claude Opus 4.8	15–25× duurder	20–35× duurder

Cache-hits voor lang-lopende agents staan bij DeepSeek op $0,003625 per 1M tokens, een factor 200 onder de oorspronkelijke prijs.

Wat er precies veranderde

Tot 22 mei was de 75%-korting een tijdelijke promotie, bedoeld om V4-Pro te lanceren. DeepSeek heeft besloten die prijsstelling permanent te maken. Input van $1.74 zakt naar $0.435 per miljoen tokens, output van $3.48 naar $0.87, en cache-hits — gebruikt voor lang-lopende agents — staan nu op $0.003625 per miljoen tokens, een factor 200 onder de oorspronkelijke prijs (Bron: InfoWorld).

V4-Pro is een 1,6 biljoen-parameter mixture-of-experts model met een 128.000-token context (wil je begrijpen wat die termen betekenen — parameters, tokens, context-venster — dan legt Hoe werkt een taalmodel van binnen? precies uit hoe de architectuur in elkaar zit). Op benchmarks rond redeneren en code zit het in de buurt van GPT-5.5 en Claude Opus 4.8 — niet identiek, maar binnen één positie verschil op de meeste leaderboards. Voor de meeste praktische toepassingen — samenvatten, schrijven, code, gestructureerde extractie — is het verschil voor de eindgebruiker zelden te merken (Bron: Caixin Global). Een week later kwam daar MiniMax M3 bij — een ander Chinees lab dat open-weights met frontier-coding, 1M context én native multimodaliteit in één model bundelt.

Waarom dit nu kan: Huawei’s Ascend-chips

Het echte nieuws zit onder de prijs. V4-Pro draait sinds deze release native op Huawei’s Ascend 950-chips — geen Nvidia meer in de stack. Dat maakt DeepSeek het eerste Chinese frontier-model dat volledig op binnenlands silicon werkt, en het verklaart waarom een 75%-prijsverlaging niet alleen een marketingstunt is.

Gevorderden:De Ascend 950 is qua throughput voor inference ruwweg vergelijkbaar met Nvidia’s H100, met een lagere prijs-per-FLOPS in de Chinese binnenmarkt. Voor DeepSeek schakelt dit twee beperkingen tegelijk uit: de Amerikaanse export-restricties op H100/B200-chips, én de inkoopkost. Dat geeft een structureel kostenvoordeel dat Westerse aanbieders niet hebben — zij betalen Nvidia-marges in dollars.

Voor Nederland is dit niet primair een geopolitieke kwestie, maar het maakt wel uit voor de strategische lange termijn van de open-source-AI-laag waar wij over schreven. Open-source modellen die op niet-Nvidia hardware draaien zijn moeilijker tegen te houden via exportbeperkingen, en de open weights van DeepSeek staan al op HuggingFace. Waarom dat raakt aan Europese AI-soevereiniteit, lees je in sovereign AI: wat het is en waarom Europa haast maakt.

Anthropic en OpenAI gaan stilletjes de andere kant op

Tegelijkertijd bewegen Westerse aanbieders in tegenovergestelde richting — maar dan technisch verborgen. Anthropic heeft de tokenizer van Claude 4.7 herontworpen, waardoor dezelfde Nederlandse tekst nu 32-45% meer tokens genereert dan voorheen. De prijs per miljoen tokens veranderde niet, dus de effectieve prijs per gesprek wel (Bron: Kingy AI). OpenAI doet iets soortgelijks via prompt-caching policies en tier-rate-limits die in de praktijk de doorlooptijd op het goedkope plan verlagen.

Dit is een patroon dat lezers van onze deep-dive over AI-inferentie in 2026 zullen herkennen: zichtbare prijzen blijven gelijk, onzichtbare kosten lopen op. DeepSeek doet het tegenovergestelde — zichtbaar én structureel lager — en gokt erop dat developers daar op stemmen met hun integraties.

Wat dit voor Nederlandse bedrijven concreet betekent

Eerst de cijfers. Een gemiddeld MKB-experiment dat een paar honderd offertes, e-mails of samenvattingen per maand laat genereren ging bij Claude Opus 4.8 al snel naar €30-60 per maand aan API-kosten. Datzelfde experiment kost bij DeepSeek V4-Pro nu €1-2. Dat is geen kortingsfeestje, het is een andere kosten-categorie.

Beginner-tip:Voor wie net begint met API-experimenten: prijzen op deze schaal maken het verschil tussen “we proberen eens iets” en “we kunnen drie ideeën parallel uitwerken zonder dat de boekhouding piept”. De grootste valkuil is dat goedkope tokens lui maken — gebruikers stoppen met prompts optimaliseren omdat het toch niets kost, en de output-kwaliteit zakt mee.

Maar er zijn drie dingen die je niet wegoptimaliseert door alleen naar de prijs te kijken:

Data-soevereiniteit. Calls naar DeepSeek’s API gaan via Chinese infrastructuur. Voor klantgegevens, medische data, juridische dossiers of intellectueel eigendom is dat geen prijs-discussie maar een compliance-discussie. Voor de meeste MKB-use-cases — schrijfondersteuning, samenvattingen van publiek materiaal, code — speelt dit minder, maar weet wat je verstuurt.

EU AI Act en menselijk toezicht. De wet maakt geen onderscheid naar herkomst van het model. Of je nu Claude, DeepSeek of een lokale Llama draait: voor hoog-risico toepassingen blijven dezelfde eisen gelden — risico-analyse, documentatie, traceerbaarheid, menselijk fiat. Een goedkoper model maakt dat niet anders.

Lange termijn-betrouwbaarheid. DeepSeek heeft eerder gratis tiers en limieten van de ene op de andere dag gewijzigd. Bouw je een product op één API-aanbieder, dan loop je dat risico — onafhankelijk van waar de aanbieder zit. Een vergelijking met andere aanbieders en een afhankelijkheidsanalyse zijn voor productie-werk de moeite waard. Voor wie diep wil duiken in de praktische tool-keuze: onze zustersite vergelijkt Claude vs ChatGPT in detail, en de aparte Claude-review geeft de prijs-feature-tabel waar deze prijsoorlog tegen wegt.

Wat de volgende stap is

Voor de meeste lezers: één concreet experiment opzetten. Pak een proces dat nu via ChatGPT of Claude loopt, draai dezelfde prompts door DeepSeek’s API (sandbox-account, geen klantdata), en vergelijk output-kwaliteit op de specifieke taak. Dat duurt twee uur, kost €0,50, en geeft een eerlijk antwoord op de vraag of de prijs-arbitrage in jouw use-case werkelijk werkt.

Wat het bredere verhaal interessant maakt is wat DeepSeek hier blootlegt: de prijzen van Westerse modellen waren in 2024-2025 grotendeels bepaald door Nvidia-marges, niet door de inherente kosten van inference. Nu er een serieuze niet-Nvidia frontier-stack bestaat, schuift dat venster op. Het bredere verhaal — Chinese open modellen die inmiddels het meeste modelverkeer verwerken — ontleden we in Waarom Chinese open AI-modellen winnen. Voor Nederlandse bedrijven die AI willen inzetten is het effect direct: experimenten worden goedkoper, schaalbaarder, en de drempel om iets te proberen valt met factor 20.

Deel dit artikel

Volg ons in Google

Veelgestelde vragen

Is DeepSeek V4-Pro echt 20 keer goedkoper dan GPT-5.5?

Voor pure output-tokens, ja — DeepSeek vraagt nu $0.87 per miljoen output-tokens, GPT-5.5 zit rond de $25-30. Voor input-tokens is het verschil kleiner maar nog steeds factor 15-25. Wat de vergelijking complexer maakt: GPT-5.5 en Claude Opus 4.8 lopen op sommige benchmarks beter, en Anthropic's nieuwe tokenizer betekent dat dezelfde Nederlandse tekst stilletjes 32-45% meer tokens verbruikt dan voorheen — een verborgen prijsverhoging.

Mag ik DeepSeek gewoon zakelijk in Nederland gebruiken?

Technisch mag het — DeepSeek heeft een Europese API-endpoint en de modellen draaien onder hun eigen voorwaarden. Maar voor data die onder de AVG valt is voorzichtigheid op z'n plek: API-calls gaan standaard via DeepSeek's eigen infrastructuur, en de gebruikersvoorwaarden zijn niet identiek aan die van Europese aanbieders. Voor experimenten, prototyping of niet-persoonsgegevens werkt het prima; voor klantdata of gevoelige documenten kijk je naar self-hosting of een EU-gebaseerde wrapper-service.

Wat zijn de Huawei Ascend 950-chips waar V4-Pro op draait?

De Ascend 950 is Huawei's eigen AI-versneller, een direct alternatief voor Nvidia's H100/B200-serie waar het Westen aan vasthangt. V4-Pro is het eerste Chinese frontier-model dat volledig op deze chips is geoptimaliseerd — geen Nvidia-versies meer onderwater. Dat is belangrijk omdat het de Amerikaanse exportbeperkingen op AI-chips ineffectief begint te maken: China heeft nu zowel het model als de hardware om dat model te draaien.

Wordt mijn data gebruikt om DeepSeek's modellen te trainen?

DeepSeek zegt nee voor API-calls van betalende klanten, maar de Engelstalige voorwaarden zijn op dit punt minder uitgesproken dan die van OpenAI of Anthropic. Onze vuistregel: ga er voorzichtigheidshalve van uit dat input via een gratis tier wél kan worden gebruikt voor training; voor de betaalde API hou je het op 'waarschijnlijk niet, maar contracteer dit expliciet als het kritiek is'.

Past dit binnen wat een gemiddeld MKB zich kan veroorloven?

Concreet: een offerte-assistent die elke werkdag tien 500-woord-offertes laat genereren kost bij DeepSeek V4-Pro ongeveer €1 per maand aan API-kosten. Bij Claude Opus 4.8 zou dezelfde workflow rond €25-30 uitkomen, en bij GPT-5.5 vergelijkbaar. Voor experimenteren en prototyping is dit een ander kosten-spel dan een jaar geleden.

InfoWorldinfoworld.com
Caixin Globalcaixinglobal.com
Kingy AIkingy.ai
Bright NL — DeepSeek zet een prijsstap die de AI-markt op de schop kan gooienbright.nl
DeepSeek API Docs — Models & Pricingapi-docs.deepseek.com
Dataconomy NL — DeepSeek verlaagt de prijs van V4 Pro met 75%nl.dataconomy.com

De prijzen naast elkaar

Wat er precies veranderde

Waarom dit nu kan: Huawei’s Ascend-chips

Anthropic en OpenAI gaan stilletjes de andere kant op

Wat dit voor Nederlandse bedrijven concreet betekent

Wat de volgende stap is

Veelgestelde vragen

Claude

Lees verder

Open AI-modellen in 2026: waarom bedrijven overstappen van ChatGPT

Bonsai 27B: dit AI-model draait volledig op je telefoon — wat merk jij ervan?

China antwoordt op Anthropic-ban met gratis AI-gigant GLM-5.2

OpenClaw: hoe een open-source agent het hele AI-veld versnelde