Op 22 mei 2026 kondigde het Chinese DeepSeek aan dat de 75%-korting op z’n vlaggenschipmodel V4-Pro, die officieel op 31 mei zou aflopen, permanent wordt. De nieuwe prijs voor de API is $0.435 per miljoen input-tokens en $0.87 per miljoen output-tokens — in de praktijk 20 tot 35 keer onder die van GPT-5.5 en Claude Opus 4.7. Wat daar onder ligt is interessanter dan de korting zelf.
Beginner-tip:Een “token” is hoe AI-modellen tekst meten. Eén Nederlandstalig woord telt meestal als één tot drie tokens. Een offerte van 500 woorden eet ongeveer 1.000 tokens; een uitgebreid gesprek met een AI-assistent al snel 20.000-50.000. De prijs per miljoen tokens vertaalt dus naar honderden tot duizenden gesprekken.
Wat er precies veranderde
Tot 22 mei was de 75%-korting een tijdelijke promotie, bedoeld om V4-Pro te lanceren. DeepSeek heeft besloten die prijsstelling permanent te maken. Input van $1.74 zakt naar $0.435 per miljoen tokens, output van $3.48 naar $0.87, en cache-hits — gebruikt voor lang-lopende agents — staan nu op $0.003625 per miljoen tokens, een factor 200 onder de oorspronkelijke prijs (Bron: InfoWorld).
V4-Pro is een 1,6 biljoen-parameter mixture-of-experts model met een 128.000-token context. Op benchmarks rond redeneren en code zit het in de buurt van GPT-5.5 en Claude Opus 4.7 — niet identiek, maar binnen één positie verschil op de meeste leaderboards. Voor de meeste praktische toepassingen — samenvatten, schrijven, code, gestructureerde extractie — is het verschil voor de eindgebruiker zelden te merken (Bron: Caixin Global). Een week later kwam daar MiniMax M3 bij — een ander Chinees lab dat open-weights met frontier-coding, 1M context én native multimodaliteit in één model bundelt.
Waarom dit nu kan: Huawei’s Ascend-chips
Het echte nieuws zit onder de prijs. V4-Pro draait sinds deze release native op Huawei’s Ascend 950-chips — geen Nvidia meer in de stack. Dat maakt DeepSeek het eerste Chinese frontier-model dat volledig op binnenlands silicon werkt, en het verklaart waarom een 75%-prijsverlaging niet alleen een marketingstunt is.
Gevorderden:De Ascend 950 is qua throughput voor inference ruwweg vergelijkbaar met Nvidia’s H100, met een lagere prijs-per-FLOPS in de Chinese binnenmarkt. Voor DeepSeek schakelt dit twee beperkingen tegelijk uit: de Amerikaanse export-restricties op H100/B200-chips, én de inkoopkost. Dat geeft een structureel kostenvoordeel dat Westerse aanbieders niet hebben — zij betalen Nvidia-marges in dollars.
Voor Nederland is dit niet primair een geopolitieke kwestie, maar het maakt wel uit voor de strategische lange termijn van de open-source-AI-laag waar wij over schreven. Open-source modellen die op niet-Nvidia hardware draaien zijn moeilijker tegen te houden via exportbeperkingen, en de open weights van DeepSeek staan al op HuggingFace.
Anthropic en OpenAI gaan stilletjes de andere kant op
Tegelijkertijd bewegen Westerse aanbieders in tegenovergestelde richting — maar dan technisch verborgen. Anthropic heeft de tokenizer van Claude 4.7 herontworpen, waardoor dezelfde Nederlandse tekst nu 32-45% meer tokens genereert dan voorheen. De prijs per miljoen tokens veranderde niet, dus de effectieve prijs per gesprek wel (Bron: Kingy AI). OpenAI doet iets soortgelijks via prompt-caching policies en tier-rate-limits die in de praktijk de doorlooptijd op het goedkope plan verlagen.
Dit is een patroon dat lezers van onze deep-dive over AI-inferentie in 2026 zullen herkennen: zichtbare prijzen blijven gelijk, onzichtbare kosten lopen op. DeepSeek doet het tegenovergestelde — zichtbaar én structureel lager — en gokt erop dat developers daar op stemmen met hun integraties.
Wat dit voor Nederlandse bedrijven concreet betekent
Eerst de cijfers. Een gemiddeld MKB-experiment dat een paar honderd offertes, e-mails of samenvattingen per maand laat genereren ging bij Claude Opus 4.7 al snel naar €30-60 per maand aan API-kosten. Datzelfde experiment kost bij DeepSeek V4-Pro nu €1-2. Dat is geen kortingsfeestje, het is een andere kosten-categorie.
Beginner-tip:Voor wie net begint met API-experimenten: prijzen op deze schaal maken het verschil tussen “we proberen eens iets” en “we kunnen drie ideeën parallel uitwerken zonder dat de boekhouding piept”. De grootste valkuil is dat goedkope tokens lui maken — gebruikers stoppen met prompts optimaliseren omdat het toch niets kost, en de output-kwaliteit zakt mee.
Maar er zijn drie dingen die je niet wegoptimaliseert door alleen naar de prijs te kijken:
Data-soevereiniteit. Calls naar DeepSeek’s API gaan via Chinese infrastructuur. Voor klantgegevens, medische data, juridische dossiers of intellectueel eigendom is dat geen prijs-discussie maar een compliance-discussie. Voor de meeste MKB-use-cases — schrijfondersteuning, samenvattingen van publiek materiaal, code — speelt dit minder, maar weet wat je verstuurt.
EU AI Act en menselijk toezicht. De wet maakt geen onderscheid naar herkomst van het model. Of je nu Claude, DeepSeek of een lokale Llama draait: voor hoog-risico toepassingen blijven dezelfde eisen gelden — risico-analyse, documentatie, traceerbaarheid, menselijk fiat. Een goedkoper model maakt dat niet anders.
Lange termijn-betrouwbaarheid. DeepSeek heeft eerder gratis tiers en limieten van de ene op de andere dag gewijzigd. Bouw je een product op één API-aanbieder, dan loop je dat risico — onafhankelijk van waar de aanbieder zit. Een vergelijking met andere aanbieders en een afhankelijkheidsanalyse zijn voor productie-werk de moeite waard. Voor wie diep wil duiken in de praktische tool-keuze: onze zustersite vergelijkt Claude vs ChatGPT in detail, en de aparte Claude-review geeft de prijs-feature-tabel waar deze prijsoorlog tegen wegt.
Wat de volgende stap is
Voor de meeste lezers: één concreet experiment opzetten. Pak een proces dat nu via ChatGPT of Claude loopt, draai dezelfde prompts door DeepSeek’s API (sandbox-account, geen klantdata), en vergelijk output-kwaliteit op de specifieke taak. Dat duurt twee uur, kost €0,50, en geeft een eerlijk antwoord op de vraag of de prijs-arbitrage in jouw use-case werkelijk werkt.
Wat het bredere verhaal interessant maakt is wat DeepSeek hier blootlegt: de prijzen van Westerse modellen waren in 2024-2025 grotendeels bepaald door Nvidia-marges, niet door de inherente kosten van inference. Nu er een serieuze niet-Nvidia frontier-stack bestaat, schuift dat venster op. Voor Nederlandse bedrijven die AI willen inzetten is het effect direct: experimenten worden goedkoper, schaalbaarder, en de drempel om iets te proberen valt met factor 20.
Samenvatting — de 5-minuten-versie
- DeepSeek maakte op 22 mei 2026 z’n 75%-korting op V4-Pro permanent — output zakt naar $0.87 per miljoen tokens, ongeveer 20-35 keer onder Westerse concurrenten.
- V4-Pro draait native op Huawei Ascend 950-chips, waardoor DeepSeek niet afhankelijk is van Nvidia en de Amerikaanse exportbeperkingen omzeilt.
- Anthropic en Google gaan technisch de andere kant op via tokenizer-aanpassingen die verborgen prijsverhogingen opleveren — let op je werkelijke kosten, niet alleen de prijslijst.
- Voor Nederlandse MKB betekent dit een dramatische daling in experimentele kosten, maar de vragen rond data-soevereiniteit, EU AI Act-compliance en afhankelijkheid blijven onveranderd.
- De eerstvolgende stap: één concreet experiment naar DeepSeek’s API draaien (geen klantdata), output-kwaliteit vergelijken, en pas dán een productie-beslissing nemen.
Bronnen
- InfoWorld — DeepSeek’s steep V4-Pro price cut escalates AI pricing war — gedetailleerde analyse van de markt-impact.
- Caixin Global — DeepSeek Cuts Flagship AI Model Prices by 75% as Funding Round Looms — Chinese marktcontext en business-rationale.
- Bright NL — DeepSeek zet een prijsstap die de AI-markt op de schop kan gooien — Nederlandse duiding.
- DeepSeek API Docs — Models & Pricing — officiële prijslijst.
- Kingy AI — DeepSeek Just Fired a Price-War Cannonball at Big AI — analyse van Anthropic/Google tokenizer-tactieken.
- Dataconomy NL — DeepSeek verlaagt de prijs van V4 Pro met 75% — kortere NL-samenvatting.