Radar · NL Radar

Anthropic's bugvinder werd te goed — · AI hallucinaties sluipen wetenschappelijke literatuur binnen · Bank of America voorspelt AI-productiviteitsboom

AI Radar Nederland 24 mei (Middag) – NL + internationaal AI nieuws

  • 276 bronnen gescand
  • 4 high-impact signalen

De vijf koppen van vandaag

  1. Anthropic’s bugvinder heeft 1600 kwetsbaarheden openbaar gemaakt — en komt nu voor iedereen
  2. AI hallucinaties infiltreren wetenschappelijke papers en medische aanbevelingen
  3. Bank of America voorspelt productiviteitsexplosie van 10x — ondanks 0,1% effect tot nu toe
  4. Het chatvenster verdwijnt naar de achtergrond: 2026 draait om autonome werknemers
  5. Studenten huren advocaten in om vals-positieve AI-beschuldigingen te bestrijden

Het nieuws van vandaag

Anthropic maakt controversiële bugzoeker alsnog openbaar

Het AI-systeem vond al 1600 kwetsbaarheden. De vrees voor misbruik blijft.

CybersecurityBedrijfsleven

Anthropic komt binnenkort met een publieke versie van Mythos, een AI-systeem dat zelfstandig beveiligingslekken in software opspoort. Sinds februari vond de tool al 1600 kwetsbaarheden in 281 codebases. Dat meldt het bedrijf op een bijgewerkt dashboard.

Tot nu toe hield Anthropic Mythos intern. De reden: een AI die zelfstandig zwakke plekken in code kan vinden, kan die kennis ook gebruiken om systemen aan te vallen. Die angst blijkt nu minder zwaar te wegen dan het nut voor beveiligingsteams.

Mythos werkt autonoom. Het systeem doorzoekt code zonder dat iemand elke stap hoeft aan te sturen. Het herkent patronen, spoort zwakke plekken op en documenteert die. Dat scheelt beveiligingsteams veel tijd. Maar diezelfde snelheid komt straks ook beschikbaar voor kwaadwillenden.

AI-hallucinaties sluipen wetenschappelijke literatuur binnen — en blijven daar

Een AI-expert ontdekte een verzonnen bron in zijn eigen paper. Hij is niet de enige.

OnderwijsWetenschap

Maxim Topaz, hoogleraar aan Columbia University, gebruikt AI om zijn teksten te verbeteren. Niets bijzonders: dat doen veel onderzoekers. Maar toen een wetenschappelijk tijdschrift vragen stelde over een van zijn bronnen, ontdekte hij iets onaangenaams. De AI had een referentie verzonnen en stilletjes in zijn paper verwerkt.

“Ik voelde me diep beschaamd,” zegt Topaz tegen Fortune. “Ik ben AI-onderzoeker. Ik weet hoe dit werkt. Ik ken het risico op hallucinaties — momenten waarop AI feiten verzint. Als dit mij overkomt, wat gebeurt er dan met anderen?”

Hij ging op onderzoek uit. Het antwoord: dit gebeurt vaker. AI-tools die schrijfhulp bieden voegen regelmatig nepbronnen, nepbehandelingen of subtiel verkeerde details toe. Die fouten zijn lastig te spotten, vooral als je weinig tijd hebt of niet diep vertrouwd bent met het onderwerp. Eenmaal gepubliceerd blijven ze staan. Ze worden geciteerd, opgenomen in databases, en vormen zo een laag verzonnen kennis in de wetenschappelijke infrastructuur.

Bank of America voorspelt AI-productiviteitsboom van 10x — maar cijfers tonen 0,1%

Wall Street ziet elektriciteit en internet in de achteruitkijkspiegel. De economie nog niet.

BedrijfslevenEconomie

Bank of America publiceert deze week een rapport met een forse claim: AI overtreft elektriciteit en internet in impact. De productiviteitsstijging die kunstmatige intelligentie zal opleveren, zou tien keer groter zijn dan wat we nu zien.

Het probleem: de huidige meetbare impact op de economie bedraagt 0,1 procent.

De kloof tussen voorspelling en werkelijkheid is enorm. Voor Wall Street-banken is er een duidelijk belang om AI neer te zetten als historische omwenteling. Dat rechtvaardigt de zeer hoge waarderingen van techbedrijven. Maar de economische data laten een ander beeld zien. Productiviteit stijgt nauwelijks. Arbeidsmarkten veranderen langzaam. En veel AI-tools vervangen nog geen bestaande werkprocessen, maar komen er bovenop.

De bank erkent dat het nog jaren kan duren voordat de werkelijke productiviteitswinst zichtbaar wordt. Die nuance past niet goed bij de vergelijking met elektriciteit en internet.

via Fortune

Bedrijven stappen af van chatbots en zetten in op AI die op de achtergrond werkt

TechnologieBedrijfsleven

De meest effectieve AI-systemen in bedrijven hebben geen chatvenster meer. In plaats daarvan draaien ze onzichtbaar op de achtergrond. Ze houden databases en dashboards in de gaten, voeren automatisch taken uit via koppelingen met andere systemen, en geven alleen een seintje als er een menselijke beslissing nodig is.

De verschuiving is duidelijk. Bedrijven gebruiken AI steeds minder als een assistent die je een vraag stelt. Ze zetten het in als een systeem dat zelfstandig processen afhandelt. Alleen bij uitzonderingen schakelt het door naar een medewerker.

De interface verandert mee. Geen tekstvak meer, maar een overzicht met statusmeldingen. Het lijkt minder op AI en meer op gewone automatisering, al zijn de stappen die het systeem zet complexer.

Chatbots maakten AI toegankelijk en zichtbaar voor een breed publiek. Nu de technologie meer impact krijgt, verdwijnt ze juist uit het zicht.

via Reddit: ArtificialInteligence

Studenten huren advocaten in om AI-beschuldigingen te bestrijden — een nieuwe industrie

Docenten zien hallucinaties als bewijs voor fraude. Voor studenten staat hun hele toekomst op het spel.

OnderwijsJuridisch

Studenten die contact opnemen met advocate Adrienne Hahn zijn vaak in paniek. Een docent heeft hen beschuldigd van fraude met AI. De gevolgen kunnen groot zijn: schorsing, een aantekening op het diploma, afwijzing door universiteiten of beroepsorganisaties. Steeds vaker blijken de beschuldigingen onterecht. Detectieprogramma’s geven foutieve uitslagen. Docenten herkennen soms menselijk werk niet meer als zodanig.

Hahn is onderdeel van een nieuwe juridische niche: advocaten die studenten verdedigen tegen AI-beschuldigingen. Het begon met enkele gevallen, maar groeit snel. Universiteiten hebben regels ingevoerd voordat de technologie betrouwbaar genoeg was. Detectietools slaan regelmatig de plank mis. Studenten die echt zelf hebben geschreven, moeten nu juridisch bewijzen dat hun tekst van henzelf is. Die omkering van bewijslast staat haaks op academische tradities.

De UK richt een AI-veiligheidsteam op dat gevaren opspoort voordat ze uitbreken

Alumni van OpenAI en Google zoeken nu naar zwakke plekken — niet in opdracht van de bedrijven, maar van de overheid.

BeleidCybersecurity

De Britse overheid heeft een AI Security Institute opgericht, bemand met voormalige medewerkers van OpenAI, Google DeepMind en andere AI-labs. Hun taak: opsporen welke risico’s in AI-systemen zich nu al ontwikkelen, voordat ze breed uitrollen. Het instituut wordt internationaal gezien als model — andere landen kijken mee hoe je AI-veiligheid kunt organiseren zonder innovatie te blokkeren.

Het team test niet alleen modellen op bekende zwaktes zoals bias of misleidende output. Ze zoeken ook naar opkomende risico’s: kunnen modellen worden misbruikt voor cyberaanvallen, desinformatie op schaal, of autonome systemen die buiten controle raken? Het verschil met eerdere toezichthouders: dit team spreekt de taal van de labs, begrijpt de techniek van binnen, en kan sneller anticiperen.

via New York Times

Voor wie zelf met AI bouwt

Claude Code ontdekt zelf betere inference-algoritmes — voor $40 en zonder menselijke tussenkomst

Onderzoekers lieten een coding agent los op het probleem van rekenkosten. Het resultaat scheelt 70 procent.

ResearchEfficiëntie

Onderzoekers van UMD, Google en Meta gebruikten AutoTTS om Claude Code zelfstandig controle-algoritmes te laten ontdekken voor AI-reasoning. Het algoritme dat eruit kwam, verlaagt de rekenkosten met ongeveer 70 procent vergeleken met standaard self-consistency, bij gelijke nauwkeurigheid. De hele zoektocht kostte 40 dollar en draaide zonder menselijke sturing.

Wat opvalt: het algoritme dat Claude vond, is niet iets dat een mens waarschijnlijk had ontworpen. Het volgt patronen die contra-intuïtief zijn, maar in de praktijk beter werken. Dat opent een vraag: als agents hun eigen optimalisaties kunnen schrijven, hoeveel van de huidige inference-stack blijft nog over?

Aanbeveling: Bekijk de paper als je zelf werkt aan reasoning-workloads — de aanpak is eenvoudig genoeg om te repliceren.

via The Decoder

Gemma 4’s thinking mode: reasoning met een budgetknop

Google’s nieuwste model kan hardop nadenken voor je output — of stilletjes, afhankelijk van wat je instelt.

Open sourceTools

Gemma 4 heeft een ingebouwde reasoning-modus, gestuurd door een speciale <|think|> token. Wanneer die actief is, genereert het model een interne redenering van maximaal 4000 tokens voordat het antwoord komt. Die tokens zijn zichtbaar maar afgelijnd — je kunt ze tonen of weglaten, afhankelijk van je use case. Het is hetzelfde patroon als DeepSeek-R1 en Claude’s extended thinking, maar nu in een open-source model.

Het verschil met andere modellen: Gemma 4 is vanaf nul getraind om reasoning te scheiden van output. Het is geen systeemprompt-truc en geen postprocessing. Je kunt het reasoning-budget instellen, zodat je niet 4000 tokens verbrandt op een ja/nee-vraag.

Aanbeveling: Test de thinking mode op complexe vragen waar tussenredeneringen helpen — maar monitor je tokenkosten bij simpele queries.

via Dev.to


Tweakers · Fortune · Fortune · Reddit · Mashable · New York Times · The Decoder · Dev.to