AI Nieuws 7 min

DeepSeek verlaagt V4-Pro met 75%: impact op Nederland

DeepSeek maakte op 22 mei 2026 z'n 75%-korting permanent. V4-Pro draait nu op Chinese Huawei-chips en is 20x goedkoper dan GPT-5.5. Wat dit voor jou betekent.

Miniatuur diorama-illustratie bij artikel 'DeepSeek verlaagt V4-Pro prijs blijvend met 75% — wat betekent dit voor Nederland?'

Op 22 mei 2026 kondigde het Chinese DeepSeek aan dat de 75%-korting op z’n vlaggenschipmodel V4-Pro, die officieel op 31 mei zou aflopen, permanent wordt. De nieuwe prijs voor de API is $0.435 per miljoen input-tokens en $0.87 per miljoen output-tokens — in de praktijk 20 tot 35 keer onder die van GPT-5.5 en Claude Opus 4.7. Wat daar onder ligt is interessanter dan de korting zelf.

Beginner-tip:Een “token” is hoe AI-modellen tekst meten. Eén Nederlandstalig woord telt meestal als één tot drie tokens. Een offerte van 500 woorden eet ongeveer 1.000 tokens; een uitgebreid gesprek met een AI-assistent al snel 20.000-50.000. De prijs per miljoen tokens vertaalt dus naar honderden tot duizenden gesprekken.

Wat er precies veranderde

Tot 22 mei was de 75%-korting een tijdelijke promotie, bedoeld om V4-Pro te lanceren. DeepSeek heeft besloten die prijsstelling permanent te maken. Input van $1.74 zakt naar $0.435 per miljoen tokens, output van $3.48 naar $0.87, en cache-hits — gebruikt voor lang-lopende agents — staan nu op $0.003625 per miljoen tokens, een factor 200 onder de oorspronkelijke prijs (Bron: InfoWorld).

V4-Pro is een 1,6 biljoen-parameter mixture-of-experts model met een 128.000-token context. Op benchmarks rond redeneren en code zit het in de buurt van GPT-5.5 en Claude Opus 4.7 — niet identiek, maar binnen één positie verschil op de meeste leaderboards. Voor de meeste praktische toepassingen — samenvatten, schrijven, code, gestructureerde extractie — is het verschil voor de eindgebruiker zelden te merken (Bron: Caixin Global). Een week later kwam daar MiniMax M3 bij — een ander Chinees lab dat open-weights met frontier-coding, 1M context én native multimodaliteit in één model bundelt.

Waarom dit nu kan: Huawei’s Ascend-chips

Het echte nieuws zit onder de prijs. V4-Pro draait sinds deze release native op Huawei’s Ascend 950-chips — geen Nvidia meer in de stack. Dat maakt DeepSeek het eerste Chinese frontier-model dat volledig op binnenlands silicon werkt, en het verklaart waarom een 75%-prijsverlaging niet alleen een marketingstunt is.

Gevorderden:De Ascend 950 is qua throughput voor inference ruwweg vergelijkbaar met Nvidia’s H100, met een lagere prijs-per-FLOPS in de Chinese binnenmarkt. Voor DeepSeek schakelt dit twee beperkingen tegelijk uit: de Amerikaanse export-restricties op H100/B200-chips, én de inkoopkost. Dat geeft een structureel kostenvoordeel dat Westerse aanbieders niet hebben — zij betalen Nvidia-marges in dollars.

Voor Nederland is dit niet primair een geopolitieke kwestie, maar het maakt wel uit voor de strategische lange termijn van de open-source-AI-laag waar wij over schreven. Open-source modellen die op niet-Nvidia hardware draaien zijn moeilijker tegen te houden via exportbeperkingen, en de open weights van DeepSeek staan al op HuggingFace.

Anthropic en OpenAI gaan stilletjes de andere kant op

Tegelijkertijd bewegen Westerse aanbieders in tegenovergestelde richting — maar dan technisch verborgen. Anthropic heeft de tokenizer van Claude 4.7 herontworpen, waardoor dezelfde Nederlandse tekst nu 32-45% meer tokens genereert dan voorheen. De prijs per miljoen tokens veranderde niet, dus de effectieve prijs per gesprek wel (Bron: Kingy AI). OpenAI doet iets soortgelijks via prompt-caching policies en tier-rate-limits die in de praktijk de doorlooptijd op het goedkope plan verlagen.

Dit is een patroon dat lezers van onze deep-dive over AI-inferentie in 2026 zullen herkennen: zichtbare prijzen blijven gelijk, onzichtbare kosten lopen op. DeepSeek doet het tegenovergestelde — zichtbaar én structureel lager — en gokt erop dat developers daar op stemmen met hun integraties.

Wat dit voor Nederlandse bedrijven concreet betekent

Eerst de cijfers. Een gemiddeld MKB-experiment dat een paar honderd offertes, e-mails of samenvattingen per maand laat genereren ging bij Claude Opus 4.7 al snel naar €30-60 per maand aan API-kosten. Datzelfde experiment kost bij DeepSeek V4-Pro nu €1-2. Dat is geen kortingsfeestje, het is een andere kosten-categorie.

Beginner-tip:Voor wie net begint met API-experimenten: prijzen op deze schaal maken het verschil tussen “we proberen eens iets” en “we kunnen drie ideeën parallel uitwerken zonder dat de boekhouding piept”. De grootste valkuil is dat goedkope tokens lui maken — gebruikers stoppen met prompts optimaliseren omdat het toch niets kost, en de output-kwaliteit zakt mee.

Maar er zijn drie dingen die je niet wegoptimaliseert door alleen naar de prijs te kijken:

Data-soevereiniteit. Calls naar DeepSeek’s API gaan via Chinese infrastructuur. Voor klantgegevens, medische data, juridische dossiers of intellectueel eigendom is dat geen prijs-discussie maar een compliance-discussie. Voor de meeste MKB-use-cases — schrijfondersteuning, samenvattingen van publiek materiaal, code — speelt dit minder, maar weet wat je verstuurt.

EU AI Act en menselijk toezicht. De wet maakt geen onderscheid naar herkomst van het model. Of je nu Claude, DeepSeek of een lokale Llama draait: voor hoog-risico toepassingen blijven dezelfde eisen gelden — risico-analyse, documentatie, traceerbaarheid, menselijk fiat. Een goedkoper model maakt dat niet anders.

Lange termijn-betrouwbaarheid. DeepSeek heeft eerder gratis tiers en limieten van de ene op de andere dag gewijzigd. Bouw je een product op één API-aanbieder, dan loop je dat risico — onafhankelijk van waar de aanbieder zit. Een vergelijking met andere aanbieders en een afhankelijkheidsanalyse zijn voor productie-werk de moeite waard. Voor wie diep wil duiken in de praktische tool-keuze: onze zustersite vergelijkt Claude vs ChatGPT in detail, en de aparte Claude-review geeft de prijs-feature-tabel waar deze prijsoorlog tegen wegt.

Wat de volgende stap is

Voor de meeste lezers: één concreet experiment opzetten. Pak een proces dat nu via ChatGPT of Claude loopt, draai dezelfde prompts door DeepSeek’s API (sandbox-account, geen klantdata), en vergelijk output-kwaliteit op de specifieke taak. Dat duurt twee uur, kost €0,50, en geeft een eerlijk antwoord op de vraag of de prijs-arbitrage in jouw use-case werkelijk werkt.

Wat het bredere verhaal interessant maakt is wat DeepSeek hier blootlegt: de prijzen van Westerse modellen waren in 2024-2025 grotendeels bepaald door Nvidia-marges, niet door de inherente kosten van inference. Nu er een serieuze niet-Nvidia frontier-stack bestaat, schuift dat venster op. Voor Nederlandse bedrijven die AI willen inzetten is het effect direct: experimenten worden goedkoper, schaalbaarder, en de drempel om iets te proberen valt met factor 20.

Samenvatting — de 5-minuten-versie

  • DeepSeek maakte op 22 mei 2026 z’n 75%-korting op V4-Pro permanent — output zakt naar $0.87 per miljoen tokens, ongeveer 20-35 keer onder Westerse concurrenten.
  • V4-Pro draait native op Huawei Ascend 950-chips, waardoor DeepSeek niet afhankelijk is van Nvidia en de Amerikaanse exportbeperkingen omzeilt.
  • Anthropic en Google gaan technisch de andere kant op via tokenizer-aanpassingen die verborgen prijsverhogingen opleveren — let op je werkelijke kosten, niet alleen de prijslijst.
  • Voor Nederlandse MKB betekent dit een dramatische daling in experimentele kosten, maar de vragen rond data-soevereiniteit, EU AI Act-compliance en afhankelijkheid blijven onveranderd.
  • De eerstvolgende stap: één concreet experiment naar DeepSeek’s API draaien (geen klantdata), output-kwaliteit vergelijken, en pas dán een productie-beslissing nemen.

Bronnen

Veelgestelde vragen

Is DeepSeek V4-Pro echt 20 keer goedkoper dan GPT-5.5?

Voor pure output-tokens, ja — DeepSeek vraagt nu $0.87 per miljoen output-tokens, GPT-5.5 zit rond de $25-30. Voor input-tokens is het verschil kleiner maar nog steeds factor 15-25. Wat de vergelijking complexer maakt: GPT-5.5 en Claude Opus 4.7 lopen op sommige benchmarks beter, en Anthropic's nieuwe tokenizer betekent dat dezelfde Nederlandse tekst stilletjes 32-45% meer tokens verbruikt dan voorheen — een verborgen prijsverhoging.

Mag ik DeepSeek gewoon zakelijk in Nederland gebruiken?

Technisch mag het — DeepSeek heeft een Europese API-endpoint en de modellen draaien onder hun eigen voorwaarden. Maar voor data die onder de AVG valt is voorzichtigheid op z'n plek: API-calls gaan standaard via DeepSeek's eigen infrastructuur, en de gebruikersvoorwaarden zijn niet identiek aan die van Europese aanbieders. Voor experimenten, prototyping of niet-persoonsgegevens werkt het prima; voor klantdata of gevoelige documenten kijk je naar self-hosting of een EU-gebaseerde wrapper-service.

Wat zijn de Huawei Ascend 950-chips waar V4-Pro op draait?

De Ascend 950 is Huawei's eigen AI-versneller, een direct alternatief voor Nvidia's H100/B200-serie waar het Westen aan vasthangt. V4-Pro is het eerste Chinese frontier-model dat volledig op deze chips is geoptimaliseerd — geen Nvidia-versies meer onderwater. Dat is belangrijk omdat het de Amerikaanse exportbeperkingen op AI-chips ineffectief begint te maken: China heeft nu zowel het model als de hardware om dat model te draaien.

Wordt mijn data gebruikt om DeepSeek's modellen te trainen?

DeepSeek zegt nee voor API-calls van betalende klanten, maar de Engelstalige voorwaarden zijn op dit punt minder uitgesproken dan die van OpenAI of Anthropic. Onze vuistregel: ga er voorzichtigheidshalve van uit dat input via een gratis tier wél kan worden gebruikt voor training; voor de betaalde API hou je het op 'waarschijnlijk niet, maar contracteer dit expliciet als het kritiek is'.

Past dit binnen wat een gemiddeld MKB zich kan veroorloven?

Concreet: een offerte-assistent die elke werkdag tien 500-woord-offertes laat genereren kost bij DeepSeek V4-Pro ongeveer €1 per maand aan API-kosten. Bij Claude Opus 4.7 zou dezelfde workflow rond €25-30 uitkomen, en bij GPT-5.5 vergelijkbaar. Voor experimenteren en prototyping is dit een ander kosten-spel dan een jaar geleden.

Bronnen

Waar deze informatie vandaan komt.

  1. InfoWorldinfoworld.com
  2. Caixin Globalcaixinglobal.com
  3. Kingy AIkingy.ai