Er zijn rapporten die je leest om de cijfers, en rapporten die je leest om wie ze publiceert. When AI builds itself, donderdag verschenen bij het Anthropic Institute, is allebei. Het bedrijf achter Claude opent voor het eerst de eigen boeken over een gevoelige vraag: hoe ver is AI met het bouwen van AI? Het antwoord — verder dan de meeste instituties beseffen — komt met een opvallend verzoek aan de rest van de wereld.
Wat er in het rapport staat
De kern van het stuk, geschreven door Marina Favaro en Jack Clark, is een trendlijn. Bij Anthropic wordt een groeiend deel van het AI-ontwikkelwerk gedaan door AI-systemen zelf. Doorgetrokken eindigt die lijn bij wat onderzoekers recursieve zelfverbetering noemen: een systeem dat volledig zelfstandig zijn eigen opvolger ontwerpt en traint (Bron: Anthropic Institute). Het rapport is er helder over dat dit punt nog niet bereikt is, en ook niet onvermijdelijk is. Maar het kan dichterbij zijn dan instellingen aankunnen.
De interne cijfers zijn het nieuws. Sinds mei 2026 is ruim 80 procent van de code die Anthropic naar productie merget door Claude geschreven; vóór februari 2025 waren dat lage enkele procenten. Een gemiddelde engineer verwerkt per dag acht keer zoveel code als in 2024. En in een interne peiling onder 130 onderzoeksmedewerkers schatte de mediaan dat ze met het interne model Mythos Preview ongeveer vier keer zoveel output draaien als zonder AI.
Beginner-tip:Laat je niet afschrikken door de term. Recursieve zelfverbetering is gewoon: AI maakt AI beter, die daarna AI nóg beter maakt, enzovoort. Waarom dat met agents te maken heeft, lees je inwat zijn AI-agents in 2026.
Anthropic relativeert de eigen cijfers overigens zelf. Regels code zijn kwantiteit, geen kwaliteit, en zelfgerapporteerde productiviteitswinst valt in de praktijk vaak lager uit. Dat siert het rapport, al blijft staan dat vrijwel al het bewijs uit Anthropics eigen keuken komt en niet extern te verifiëren is.
Van twaalf minuten naar twaalf uur
De externe meetlat komt van METR, het instituut dat bijhoudt hoe lang AI-modellen zelfstandig aan een taak kunnen werken. Die duur verdubbelt inmiddels ongeveer elke vier maanden, waar dat eerder zeven maanden was. Claude Opus 3 deed in maart 2024 taken van vier minuten. Claude Opus 4.6 haalt twaalf uur. Het interne Mythos Preview werkte in METR-tests “minstens” zestien uur door en zat daarmee aan de bovenkant van wat het instituut überhaupt kan meten.
Eén voorbeeld uit het rapport blijft hangen. In april 2026 leverde Claude meer dan 800 fixes af die een categorie API-fouten met een factor duizend terugdrongen. De begeleidende engineer schatte dat een mens daar vier jaar over had gedaan. Niet omdat het moeilijk was, maar omdat het saai was: andermans bugs oplossen is traag, pijnlijk werk waar geen mens de context voor in zijn hoofd houdt.
Gevorderden:De interessantste interne benchmark is de optimalisatie-loop: Claude krijgt trainings-code en moet die sneller maken zonder de correctheid te breken. Claude Opus 4 haalde in mei 2025 ~3x versnelling, Mythos Preview in april 2026 ~52x; een vakkundige menselijke onderzoeker haalt ~4x in vier tot acht uur. Let wel: het absolute getal hangt sterk af van hoeveel ruimte de startcode laat. De vergelijking over modellen heen is informatiever dan de 52x zelf.
De zwakke plek heet onderzoekssmaak
Waarom is dit dan nog geen zelfbouwende AI? Omdat er één ding overblijft dat mensen aantoonbaar beter doen: kiezen. Welk probleem is het waard om aan te werken, welk resultaat verdient vertrouwen, wanneer is een richting een doodlopende weg. Het rapport noemt dit research taste, en erkent dat de kloof daar groot blijft.
Al schuift ook die grens op. In een test op 129 momenten waar menselijke onderzoekers een verkeerde afslag namen, koos Opus 4.5 in november 2025 in 51 procent van de gevallen een betere vervolgstap dan de mens; Mythos Preview zat in april op 64 procent. En in april publiceerde Anthropic een experiment waarin Claude-agents een open veiligheidsprobleem volledig zelfstandig onderzochten: twee menselijke onderzoekers overbrugden in een week zo’n 23 procent van de prestatie-kloof, de agents 97 procent — in 800 uur en voor 18.000 dollar aan rekenkracht.
Er zit een ironische voetnoot aan dit hoofdstuk. Hoe meer code Claude schrijft, hoe meer menselijke review de bottleneck wordt. Hoe goed mensen die rol aankunnen is precies de vraag die het sabotage-experiment van Northeastern University deze week beantwoordde: 94 procent van de developers zag bewuste misleiding door hun AI-assistent niet eens. De twee publicaties lezen als één verhaal in twee delen.
Geen verbod, wel een noodrem die echt werkt
Dan het deel dat de meeste krantenkoppen haalde, en vaak nét verkeerd. Anthropic roept niet op tot een onmiddellijke stop, en al helemaal niet tot een verbod. Het pleidooi is preciezer: de wereld moet de optie hebben om frontier-AI-ontwikkeling te vertragen of tijdelijk te pauzeren (Bron: PYMNTS). Daarvoor zijn verificatiesystemen nodig waarmee labs en overheden kunnen vaststellen dat anderen óók echt vertragen, vergelijkbaar met wapenbeheersingsregimes. Trainingsruns zijn alleen veel makkelijker te verbergen dan raketsilo’s, geeft het rapport toe. Bestaan zulke systemen en doen andere frontier-labs verifieerbaar mee, dan zegt Anthropic zelf ook te zullen pauzeren.
Het bedrijf kondigt aan de komende maanden gesprekken te organiseren met beleidsmakers, onderzoekers en andere AI-bedrijven, en de uitkomsten te publiceren. Voor Nederlandse en Europese beleidsmakers is dat relevanter dan het lijkt: de EU AI Act reguleert wat AI-systemen doen, niet hoe snel ze zichzelf verbeteren. Voor dat tweede bestaat nog geen enkel instrument.
Gevorderden:De timing is niet toevallig. Anthropic is met een waardering van965 miljard dollar net OpenAI gepasseerden heeft met Mythos een intern model dat hetin de financiële sector al commercieel uitrolt. Een koploper die om een noodrem vraagt, vraagt ook impliciet om regels die de achtervolgers afremmen. Beide lezingen kunnen tegelijk waar zijn.
Wat critici ervan vinden
De sceptische reacties kwamen snel. Mark Riedl, hoogleraar aan Georgia Tech, schreef op Bluesky dat “de grote AI-bedrijven allemaal op de zelfverbeterings-hypetrein springen” (Bron: Scientific American). Yann LeCun, die Meta verliet om AMI Labs te starten, herhaalt zijn bekende bezwaar: de huidige architecturen missen het begrip dat voor echte autonomie nodig is.
Daar staat tegenover dat het rapport zelf drie scenario’s openhoudt, inclusief het scenario waarin de trend afvlakt omdat schaalvergroting tegen een S-curve aanloopt, of omdat chips en stroomnet de echte bottleneck blijken — een grens die we in Nederland al kennen van de botsing tussen AI-datacenters en het stroomnet. Dat een rapport over exponentiële groei zijn eigen tegenargumenten serieus uitwerkt, is in dit genre zeldzaam genoeg om te benoemen.
Voor wie hier nuchter naar wil kijken is de bruikbaarste samenvatting misschien deze: het routinewerk van AI-ontwikkeling is aantoonbaar geautomatiseerd, het richtinggevende werk nog niet, en de race zit in de vraag hoe lang dat “nog niet” houdbaar blijft. Wat dat betekent voor je eigen werk met autonome agents die op de achtergrond draaien, verandert daar voorlopig weinig aan. Wat het betekent voor de vraag wie er over twee jaar aan de knoppen zit, des te meer.
Samenvatting — de 5-minuten-versie
- Het Anthropic Institute publiceerde op 4 juni 2026 ‘When AI builds itself’: intern bewijs dat AI-systemen de ontwikkeling van AI al fors versnellen, geschreven door Marina Favaro en Jack Clark.
- Ruim 80% van Anthropics productie-code is sinds mei 2026 door Claude geschreven; de duur van taken die modellen zelfstandig aankunnen verdubbelt volgens METR elke vier maanden.
- Volledige recursieve zelfverbetering bestaat nog niet: mensen kiezen nog de onderzoeksrichting. Maar ook die ‘research taste’ verbetert meetbaar (van 51% naar 64% betere vervolgstappen in een half jaar).
- Anthropic pleit voor een verifieerbare pauze-óptie voor frontier-AI, geen verbod — en zegt zelf mee te pauzeren als andere labs verifieerbaar hetzelfde doen.
- Critici (Riedl, LeCun) zien hype en wijzen erop dat vrijwel al het bewijs uit Anthropics eigen, niet extern verifieerbare data komt.
Bronnen
- Anthropic Institute — When AI builds itself — het volledige rapport van 4 juni 2026.
- Scientific American — Anthropic warns AI may soon begin recursive self-improvement — verslag met reacties van externe wetenschappers.
- PYMNTS — Anthropic wants a global AI pause if everyone else does — over het pauze-voorstel en de voorwaarden.
- METR — Time horizons onderzoek — de externe meetlat voor taakduur-verdubbeling.