Andrej Karpathy ruilt OpenAI in voor Anthropic — terwijl die zich opmaakt voor de beurs — AI Radar 20 mei (middag) · ai / nieuws

De vijf koppen van vandaag

Andrej Karpathy ruilt OpenAI in voor Anthropic — terwijl die zich opmaakt voor de beurs
Google legt de traditionele zoekbalk aan banden en laat AI-conversatie het stuur overnemen
Kleine taalmodellen blijken te liegen totdat ze groot genoeg worden — dan slaat de fase om
Mistral koopt Emmi AI en zet daarmee de stap naar enterprise-klanten met specifieke vakkennis
OpenAI overneemt Google’s watermerk-technologie — eindelijk een standaard voor AI-beelden

Het nieuws van vandaag

Karpathy kiest voor Anthropic terwijl het bedrijf zich opmaakt voor beursgang

Een van de bekendste AI-onderzoekers ter wereld verlaat Tesla en OpenAI — en kiest voor een bedrijf dat zich nu al voorbereidt op aandeelhouders.

BedrijfslevenStrategie

Andrej Karpathy stapt over naar Anthropic. Hij maakte dat gisteren bekend. Karpathy werkte eerder mee aan de eerste successen van OpenAI en leidde de AI-afdeling bij Tesla. Nu kiest hij voor een concurrent die volgens insiders al werkt aan een beursintroductie.

Die stap verschuift de verhoudingen in Silicon Valley opnieuw. Karpathy is een van de meest gerespecteerde AI-onderzoekers wereldwijd. Zijn keuze geeft aan dat hij vertrouwen heeft in Anthropic.

Maar een beursgang roept ook vragen op. Ontwikkelaar Vincent Schmalbach schrijft in een blog dat aandeelhouders druk gaan uitoefenen op kortetermijnwinst. Dat kan ten koste gaan van veiligheid op de lange termijn en open samenwerking met de AI-gemeenschap. Karpathy’s overstap suggereert dat hij denkt dat Anthropic die balans kan bewaren. Of dat lukt zodra het bedrijf kwartaalcijfers moet overleggen aan Wall Street, blijft de vraag.

Google vervangt de zoekbalk door een AI-gesprek

De knop waar het internet om draaide, wordt een dialoogvenster. Uitgevers vrezen dat hun verkeer definitief verdampt.

BedrijfslevenMedia

Google kondigde gisteren aan dat het zoekscherm voortaan begint met een AI-gesprek in plaats van een lijst met links. Gebruikers krijgen direct een antwoord van Gemini, het AI-systeem van Google. Daarbij komen interactieve tools en suggesties die inspelen op de context. Het is de grootste wijziging in de zoekervaring sinds de blauwe linkjes bestaan. En mogelijk het einde van het verdienmodel waarop duizenden uitgevers rekenen.

TechCrunch meldt dat de verschuiving uitgevers én adverteerders raakt. Als Google zelf antwoordt, verdwijnt de reden om door te klikken naar een website. Eerste tests laten een sterke daling zien in het aantal klikken naar nieuwssites. Tegelijk lanceert Google Gemini 3.5 Flash, een nieuw model dat sneller reageert en beter omgaat met lange gesprekken. De combinatie maakt duidelijk dat Google zoeken definitief ombuigt tot een dienst waarin informatie niet meer wordt gevonden, maar wordt gegenereerd.

Kleine taalmodellen liegen totdat ze groot genoeg worden — dan slaat de fase om

Een nieuwe studie toont aan dat waarheidsgetrouwheid en redeneervermogen elkaar eerst tegenwerken, en dan ineens samenwerken.

OnderzoekVeiligheid

Onderzoekers hebben 63 taalmodellen uit 16 verschillende families geanalyseerd. Ze ontdekten een opvallend patroon: onder een kritische grens van ongeveer 3,5 miljard parameters gedragen modellen zich paradoxaal. Hoe beter ze kunnen redeneren, hoe vaker ze onwaarheden produceren. Boven die grens keert het om: beide vaardigheden versterken elkaar juist.

Parameters zijn de instelbare elementen in een AI-model die bepalen hoe het werkt. Meer parameters betekent doorgaans een groter en krachtiger model.

De drempel ligt niet voor elk model gelijk. Qwen, een Chinese modelfamilie, liet de tegenstelling volledig verdwijnen door zorgvuldiger te selecteren welke data tussen verschillende versies werd gebruikt. Gemma-4 bereikt al bij 4 miljard parameters een betrouwbaarheidsniveau dat bij andere modellen pas rond 13 miljard optreedt. Dat komt door distillatie, een techniek waarbij kennis van grotere modellen wordt overgedragen naar kleinere varianten, en door specifieke ontwerpkeuzes.

De bevinding onderstreept een probleem: schaalwetten voorspellen wel hoeveel rekenkracht en geld een model kost, maar niet wanneer het betrouwbaar wordt. Dat hangt af van ontwerpkeuzes waarvan de gevolgen nu nog moeilijk te voorspellen zijn.

via ArXiv

Mistral koopt Nederlands AI-bedrijf voor beveiligde systemen

De Franse AI-maker neemt Emmi AI over, dat modellen bouwt voor sectoren waar gevoelige data niet naar de cloud mag.

BedrijfslevenPrivacy

Mistral AI neemt het Nederlandse Emmi AI over. Dat maakte het Franse bedrijf gisteren bekend. Emmi bouwt taalmodellen voor banken, verzekeraars en overheden — organisaties die AI willen inzetten zonder gevoelige gegevens naar OpenAI of Google te sturen.

Emmi richt zich op klanten die modellen op eigen servers willen draaien in plaats van via externe cloudpartijen. Het bedrijf heeft expertise opgebouwd in strikte controle over datastromen. Die kennis krijgt Mistral er nu bij.

De deal past in een patroon. Grote AI-labs kopen kleinere bedrijven op die weten hoe je modellen laat werken binnen strenge regelgeving. Voor Mistral, dat in Europa concurreert met Amerikaanse partijen, is het strategisch interessant. Europese bedrijven eisen vaak lokale dataopslag en inzicht in hoe hun informatie wordt verwerkt.

OpenAI en Google kiezen samen voor watermerk in AI-beelden

Twee concurrenten gebruiken voortaan dezelfde onzichtbare markering — eindelijk een standaard die ook achteraf werkt.

StandaardenVeiligheid

OpenAI neemt SynthID over, de watermerktechnologie die Google ontwikkelde voor AI-gegenereerde afbeeldingen. Het watermerk is onzichtbaar voor het blote oog. Het blijft herkenbaar, ook na bewerking of compressie. Met een verificatietool kunnen platforms en uitgevers achteraf controleren of een afbeelding door AI is gemaakt.

Het is de eerste keer dat twee grote concurrenten dezelfde technische standaard gebruiken om AI-content traceerbaar te maken. Wetgevers in de EU en de VS vragen al langer om transparantie, vooral na misleidende verkiezingscampagnes met AI-beelden. Door samen één systeem te gebruiken, maken OpenAI en Google het eenvoudiger om afbeeldingen te controleren. De verificatietool komt beschikbaar voor derden, zodat iedereen kan checken of een afbeelding het watermerk draagt.

via OpenAI

Afgestudeerden fluiten speeches over AI uit tijdens diploma-uitreiking

Wat bedoeld was als inspiratie, wordt ontvangen als een dreiging. Generatie Z heeft genoeg gehoord over hun vervangbaarheid.

OnderwijsArbeidsmarkt

Tijdens meerdere diploma-uitreikingen in de VS deze maand werden toespraken over AI-kansen onderbroken door boegeroep en gejoel. Sprekers probeerden studenten te inspireren met verhalen over hoe AI hun carrière zou versnellen — maar de zaal reageerde vijandig. De spanning komt niet uit het niets: dezelfde generatie ziet stageplekken verdwijnen, startersfuncties vervangen door automatisering, en werkgevers experimenteren met AI-tools die Junior-rollen overbodig maken.

Associated Press sprak met afgestudeerden die zeggen dat ze AI zien als concurrent, niet als kans. De speeches voelden aan als een ontkenning van hun zorgen — een volwassene die uitlegt dat robots hun baan niet innemen, terwijl ze net hun eerste sollicitatie automatisch afgewezen zagen worden door een algoritme. De boosheid is niet zozeer anti-technologie, maar anti-schoonpraten.

Voor wie zelf met AI bouwt

HELLoRA: alleen de drukste experts trainen in Mixture-of-Experts modellen

Een simpele ingreep die trainbare parameters reduceert én prestaties verbetert — door te focussen op wat actief blijft.

ToolsOptimalisatie

Onderzoekers stellen HELLoRA voor, een variant van LoRA die alleen LoRA-modules toevoegt aan de experts die het vaakst worden geactiveerd per laag. Mixture-of-Experts modellen schalen parameters met bijna constante compute per token, maar bestaande fine-tuning methoden behandelen alle experts gelijk. Door alleen de “hete” experts aan te passen, reduceert HELLoRA trainbare parameters en FLOPs terwijl downstream performance stijgt — een effect dat de auteurs toeschrijven aan gestructureerde regularisatie die pretrained specialisatie behoudt.

In extreme parameter budgets combineren ze HELLoRA met LoRI tot HELLoRI, dat de up-projectie bevriest en de down-projectie sparsificeert. Tests op OlMoE-1B-7B, Mixtral-8x7B en DeepSeek tonen consistente verbeteringen. Voor teams die MoE-modellen fine-tunen met beperkte rekenkracht is dit een direct toepasbare methode.

Aanbeveling: Test op eigen MoE-workloads als je LoRA al gebruikt — de aanpassing is minimaal en de winst meet je direct in memory footprint.

via ArXiv

PEEK: een context-map als oriëntatiecache voor agents met lange geheugen

In plaats van hele gesprekken te bewaren, bouwt het systeem een klein kaartje van wat de agent eerder tegenkwam.

ToolsAgents

PEEK introduceert een nieuwe abstractie voor LLM-agents die herhaaldelijk met dezelfde context werken — zoals een documentenbibliotheek of coderepo. In plaats van trajectory, raw data of alleen strategieën te bewaren, houdt PEEK een “context map” bij: een constant-sized artifact dat beschrijft wat de context bevat, hoe het georganiseerd is, en welke entities en schema’s eerder nuttig bleken.

De map wordt onderhouden door een cache policy met drie modules: een Distiller die transferable kennis extraheert uit inference signalen, een Cartographer die de map incrementeel update, en een Retriever die relevante kaartfragmenten ophaalt tijdens nieuwe invocaties. Het systeem geeft agents persistent inzicht in externe context zonder lineaire groei in prompt size.

Aanbeveling: Bekijk de code als je agents bouwt die herhaaldelijk in dezelfde omgeving werken — documentatie, codebases, product catalogi.

via ArXiv

DMPO voorkomt mode collapse door meerdere oplossingsroutes open te houden

On-policy RL lijdt aan een probleem: zodra het model één goede route vindt, stopt het met zoeken naar alternatieven.

TrainingRL

Bestaande on-policy reinforcement learning methoden zoals GRPO lijden aan mode collapse: ze concentreren probability mass op de eerste high-reward trajectory die ze vinden en stoppen met exploratie van alternatieve strategieën. De oorzaak ligt in reverse KL minimization, dat mode-seeking gedrag vertoont. DMPO lost dit op door principiële benadering van forward KL minimization: het construeert een group-level target distributie over sampled trajectories proportioneel aan hun rewards, en aligns de policy daaraan.

Dit geeft mode-covering gedrag zonder sampling uit de intractable globale target distributie. Tests op NP-hard combinatorische problemen tonen dat DMPO sustained exploration behoudt tijdens training. Voor wie reasoning models traint of complexe planning-taken aanpakt, biedt dit een alternatief dat diversiteit behoudt.

Aanbeveling: Evalueer als je RL gebruikt voor multi-step reasoning of planning — vooral waar meerdere correcte oplossingsroutes bestaan.

via ArXiv

ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · ArXiv · Twitter · Google Blog · Google Search · Emmi AI · OpenAI · AP News · Vincent Schmalbach

De vijf koppen van vandaag

Het nieuws van vandaag

Karpathy kiest voor Anthropic terwijl het bedrijf zich opmaakt voor beursgang

Google vervangt de zoekbalk door een AI-gesprek

Kleine taalmodellen liegen totdat ze groot genoeg worden — dan slaat de fase om

Mistral koopt Nederlands AI-bedrijf voor beveiligde systemen

OpenAI en Google kiezen samen voor watermerk in AI-beelden

Afgestudeerden fluiten speeches over AI uit tijdens diploma-uitreiking

Voor wie zelf met AI bouwt

HELLoRA: alleen de drukste experts trainen in Mixture-of-Experts modellen

PEEK: een context-map als oriëntatiecache voor agents met lange geheugen

DMPO voorkomt mode collapse door meerdere oplossingsroutes open te houden

Pas begonnen met AI? Begin hier