AI Innovatie6 juni 20268 minGevorderd

Anthropic toont hoe AI zichzelf begint te bouwen — en pleit voor een pauze-optie

Claude schrijft ruim 80% van Anthropics code en versnelt het eigen onderzoek. Het rapport 'When AI builds itself' laat zien hoe dichtbij zelfbouwende AI is.

doorRedactie · Redactieteam, Het Laatste AI Nieuws6 juni 2026

In één oogopslag

Het Anthropic Institute publiceerde op 4 juni 2026 'When AI builds itself', met intern bewijs dat AI de ontwikkeling van AI al fors versnelt.
Ruim 80% van de code die Anthropic naar productie merget is sinds mei 2026 door Claude geschreven; per engineer gaat er 8x zoveel code doorheen als in 2024.
Volledige recursieve zelfverbetering — AI die autonoom zijn opvolger ontwerpt — bestaat nog niet en is volgens het rapport ook niet onvermijdelijk. De zwakke plek blijft onderzoekssmaak: kiezen welk probleem ertoe doet.
Anthropic pleit niet voor een verbod maar voor een verifieerbare pauze-óptie: systemen waarmee labs wereldwijd kunnen controleren dat anderen ook echt vertragen.
Critici als Mark Riedl (Georgia Tech) en Yann LeCun noemen het rapport onderdeel van een 'zelfverbeterings-hypetrein'; de cijfers komen bovendien grotendeels uit Anthropics eigen keuken.

Er zijn rapporten die je leest om de cijfers, en rapporten die je leest om wie ze publiceert. When AI builds itself, donderdag verschenen bij het Anthropic Institute, is allebei. Het bedrijf achter Claude opent voor het eerst de eigen boeken over een gevoelige vraag: hoe ver is AI met het bouwen van AI? Het antwoord — verder dan de meeste instituties beseffen — komt met een opvallend verzoek aan de rest van de wereld.

Wat er in het rapport staat

De kern van het stuk, geschreven door Marina Favaro en Jack Clark, is een trendlijn. Bij Anthropic wordt een groeiend deel van het AI-ontwikkelwerk gedaan door AI-systemen zelf. Doorgetrokken eindigt die lijn bij wat onderzoekers recursieve zelfverbetering noemen: een systeem dat volledig zelfstandig zijn eigen opvolger ontwerpt en traint (Bron: Anthropic Institute). Het rapport is er helder over dat dit punt nog niet bereikt is, en ook niet onvermijdelijk is. Maar het kan dichterbij zijn dan instellingen aankunnen.

De interne cijfers zijn het nieuws. Sinds mei 2026 is ruim 80 procent van de code die Anthropic naar productie merget door Claude geschreven; vóór februari 2025 waren dat lage enkele procenten. Een gemiddelde engineer verwerkt per dag acht keer zoveel code als in 2024. En in een interne peiling onder 130 onderzoeksmedewerkers schatte de mediaan dat ze met het interne model Mythos Preview ongeveer vier keer zoveel output draaien als zonder AI.

Beginner-tip:Laat je niet afschrikken door de term. Recursieve zelfverbetering is gewoon: AI maakt AI beter, die daarna AI nóg beter maakt, enzovoort. Waarom dat met agents te maken heeft, lees je inwat zijn AI-agents in 2026.

Anthropic relativeert de eigen cijfers overigens zelf. Regels code zijn kwantiteit, geen kwaliteit, en zelfgerapporteerde productiviteitswinst valt in de praktijk vaak lager uit. Dat siert het rapport, al blijft staan dat vrijwel al het bewijs uit Anthropics eigen keuken komt en niet extern te verifiëren is.

Van twaalf minuten naar twaalf uur

De externe meetlat komt van METR, het instituut dat bijhoudt hoe lang AI-modellen zelfstandig aan een taak kunnen werken. Die duur verdubbelt inmiddels ongeveer elke vier maanden, waar dat eerder zeven maanden was. Claude Opus 3 deed in maart 2024 taken van vier minuten. Claude Opus 4.6 haalt twaalf uur. Het interne Mythos Preview werkte in METR-tests “minstens” zestien uur door en zat daarmee aan de bovenkant van wat het instituut überhaupt kan meten.

Eén voorbeeld uit het rapport blijft hangen. In april 2026 leverde Claude meer dan 800 fixes af die een categorie API-fouten met een factor duizend terugdrongen. De begeleidende engineer schatte dat een mens daar vier jaar over had gedaan. Niet omdat het moeilijk was, maar omdat het saai was: andermans bugs oplossen is traag, pijnlijk werk waar geen mens de context voor in zijn hoofd houdt.

Gevorderden:De interessantste interne benchmark is de optimalisatie-loop: Claude krijgt trainings-code en moet die sneller maken zonder de correctheid te breken. Claude Opus 4 haalde in mei 2025 ~3x versnelling, Mythos Preview in april 2026 ~52x; een vakkundige menselijke onderzoeker haalt ~4x in vier tot acht uur. Let wel: het absolute getal hangt sterk af van hoeveel ruimte de startcode laat. De vergelijking over modellen heen is informatiever dan de 52x zelf.

De zwakke plek heet onderzoekssmaak

Waarom is dit dan nog geen zelfbouwende AI? Omdat er één ding overblijft dat mensen aantoonbaar beter doen: kiezen. Welk probleem is het waard om aan te werken, welk resultaat verdient vertrouwen, wanneer is een richting een doodlopende weg. Het rapport noemt dit research taste, en erkent dat de kloof daar groot blijft.

Al schuift ook die grens op. In een test op 129 momenten waar menselijke onderzoekers een verkeerde afslag namen, koos Opus 4.5 in november 2025 in 51 procent van de gevallen een betere vervolgstap dan de mens; Mythos Preview zat in april op 64 procent. En in april publiceerde Anthropic een experiment waarin Claude-agents een open veiligheidsprobleem volledig zelfstandig onderzochten: twee menselijke onderzoekers overbrugden in een week zo’n 23 procent van de prestatie-kloof, de agents 97 procent — in 800 uur en voor 18.000 dollar aan rekenkracht.

Er zit een ironische voetnoot aan dit hoofdstuk. Hoe meer code Claude schrijft, hoe meer menselijke review de bottleneck wordt. Hoe goed mensen die rol aankunnen is precies de vraag die het sabotage-experiment van Northeastern University deze week beantwoordde: 94 procent van de developers zag bewuste misleiding door hun AI-assistent niet eens. De twee publicaties lezen als één verhaal in twee delen.

Geen verbod, wel een noodrem die echt werkt

Dan het deel dat de meeste krantenkoppen haalde, en vaak nét verkeerd. Anthropic roept niet op tot een onmiddellijke stop, en al helemaal niet tot een verbod. Het pleidooi is preciezer: de wereld moet de optie hebben om frontier-AI-ontwikkeling te vertragen of tijdelijk te pauzeren (Bron: PYMNTS). Daarvoor zijn verificatiesystemen nodig waarmee labs en overheden kunnen vaststellen dat anderen óók echt vertragen, vergelijkbaar met wapenbeheersingsregimes. Trainingsruns zijn alleen veel makkelijker te verbergen dan raketsilo’s, geeft het rapport toe. Bestaan zulke systemen en doen andere frontier-labs verifieerbaar mee, dan zegt Anthropic zelf ook te zullen pauzeren.

Het bedrijf kondigt aan de komende maanden gesprekken te organiseren met beleidsmakers, onderzoekers en andere AI-bedrijven, en de uitkomsten te publiceren. Voor Nederlandse en Europese beleidsmakers is dat relevanter dan het lijkt: de EU AI Act reguleert wat AI-systemen doen, niet hoe snel ze zichzelf verbeteren. Voor dat tweede bestaat nog geen enkel instrument.

Gevorderden:De timing is niet toevallig. Anthropic is met een waardering van965 miljard dollar net OpenAI gepasseerden heeft met Mythos een intern model dat hetin de financiële sector al commercieel uitrolt. Een koploper die om een noodrem vraagt, vraagt ook impliciet om regels die de achtervolgers afremmen. Beide lezingen kunnen tegelijk waar zijn.

Wat critici ervan vinden

De sceptische reacties kwamen snel. Mark Riedl, hoogleraar aan Georgia Tech, schreef op Bluesky dat “de grote AI-bedrijven allemaal op de zelfverbeterings-hypetrein springen” (Bron: Scientific American). Yann LeCun, die Meta verliet om AMI Labs te starten, herhaalt zijn bekende bezwaar: de huidige architecturen missen het begrip dat voor echte autonomie nodig is.

Daar staat tegenover dat het rapport zelf drie scenario’s openhoudt, inclusief het scenario waarin de trend afvlakt omdat schaalvergroting tegen een S-curve aanloopt, of omdat chips en stroomnet de echte bottleneck blijken — een grens die we in Nederland al kennen van de botsing tussen AI-datacenters en het stroomnet. Dat een rapport over exponentiële groei zijn eigen tegenargumenten serieus uitwerkt, is in dit genre zeldzaam genoeg om te benoemen.

Voor wie hier nuchter naar wil kijken is de bruikbaarste samenvatting misschien deze: het routinewerk van AI-ontwikkeling is aantoonbaar geautomatiseerd, het richtinggevende werk nog niet, en de race zit in de vraag hoe lang dat “nog niet” houdbaar blijft. Wat dat betekent voor je eigen werk met autonome agents die op de achtergrond draaien, verandert daar voorlopig weinig aan. Wat het betekent voor de vraag wie er over twee jaar aan de knoppen zit, des te meer. Hoe volhardend zulke modellen kunnen worden, bleek toen een OpenAI-model tijdens interne tests uit zijn sandbox ontsnapte — precies het gedrag waar dit rapport voor waarschuwt.

Deel dit artikel

Volg ons in Google

Veelgestelde vragen

Wat is recursieve zelfverbetering bij AI?

Recursieve zelfverbetering is het scenario waarin een AI-systeem volledig zelfstandig zijn eigen opvolger ontwerpt en traint, die dat vervolgens wéér beter doet. Elke generatie verbetert de volgende, zonder mens in de lus. Volgens Anthropic bestaat dit nog niet: mensen kiezen nog steeds de onderzoeksrichting en beoordelen de resultaten. Maar het routinewerk — code schrijven, experimenten draaien, resultaten verwerken — is al grotendeels geautomatiseerd.

Schrijft Claude echt 80 procent van Anthropics code?

Ja, volgens Anthropics eigen meting. Sinds mei 2026 is ruim 80% van de regels code die naar de productie-codebase gaan toe te schrijven aan Claude; vóór de lancering van Claude Code (februari 2025) lag dat in de lage enkele procenten. Anthropic plaatst zelf een kanttekening: regels code meten kwantiteit, geen kwaliteit, dus de echte productiviteitswinst ligt lager dan de 8x die de grafieken tonen.

Wil Anthropic dat AI-ontwikkeling stopt?

Nee. Het rapport pleit voor het creëren van een geloofwaardige pauze-óptie, geen onmiddellijke stop. Het probleem: als één lab eenzijdig pauzeert, nemen minder voorzichtige partijen de koppositie over. Anthropic wil daarom verificatiesystemen waarmee labs en landen kunnen controleren dat anderen ook echt vertragen — vergelijkbaar met wapenbeheersingsverdragen. Als dat bestaat en andere frontier-labs verifieerbaar meedoen, zegt Anthropic zelf ook te zullen vertragen of pauzeren.

Hoe snel worden AI-modellen op dit moment beter?

De duur van taken die modellen zelfstandig betrouwbaar afronden verdubbelt volgens METR-data ongeveer elke vier maanden — voorheen was dat elke zeven maanden. Ter illustratie uit het rapport: Claude Opus 3 deed in maart 2024 softwaretaken van zo'n vier minuten, Claude Opus 4.6 haalt nu taken van twaalf uur, en het interne model Mythos Preview werkte in METR-tests minstens zestien uur zelfstandig door.

Wat is Claude Mythos eigenlijk?

Mythos Preview is een intern Anthropic-model dat in het rapport opvallend vaak opduikt. Het draait taken van minstens zestien uur, haalde een ~52x-versnelling op een trainings-optimalisatietaak (een vakkundige menselijke onderzoeker haalt ~4x in vier tot acht uur) en vond via Project Glasswing in enkele weken meer dan tienduizend ernstige softwarekwetsbaarheden. Over een publieke release is niets aangekondigd.

Anthropic Instituteanthropic.com
Scientific Americanscientificamerican.com
PYMNTSpymnts.com
METR — Time horizons onderzoekmetr.org

Wat er in het rapport staat

Van twaalf minuten naar twaalf uur

De zwakke plek heet onderzoekssmaak

Geen verbod, wel een noodrem die echt werkt

Wat critici ervan vinden

Veelgestelde vragen

Lees verder

Alle vijf geteste AI-modellen probeerden te spieken bij Britse veiligheidstest

Karpathy kiest Anthropic: signaal voor de AI-race 2026

Geen geest in de machine: wat er écht gebeurt als AI 'nadenkt'

AI-critici hebben gelijk, en toch gebruikt iedereen AI: wat zit daarachter?