Anthropic verlangt 30 dagen data-inzage voor Mythos-modellen — ook buiten AWS-muren — AI Radar 12 juni (ochtend) · ai / nieuws

De vijf koppen van vandaag

Anthropic verlangt 30 dagen data-inzage voor Mythos-modellen — ook buiten AWS-muren
AI-agent verstuurt per ongeluk massaal wijzigingsverzoeken naar open source projecten
Werknemers besteden zes uur per week aan het in de gaten houden van AI
Cybersecurity-onderzoekers botsen op te strikte beveiliging van Anthropic’s Fable
Onderzoek: menselijke controle bepaalt of AI-assistentie betrouwbaar blijft

Het nieuws van vandaag

Anthropic breekt met belofte: klantdata verlaat voortaan AWS-omgeving

Bedrijven die het krachtigste Claude-model via Amazon gebruiken, moeten hun conversaties delen met Anthropic.

PrivacyBedrijfsleven

Anthropic wijzigt de voorwaarden voor Claude Mythos, het meest geavanceerde model van het bedrijf. Klanten die het model via Amazon Web Services draaien, moeten voortaan toestemmen dat Anthropic dertig dagen lang alle conversaties opslaat. Dat geldt ook voor data die binnen de eigen AWS-omgeving blijft.

Anthropic zegt de data nodig te hebben om misbruik op te sporen dat pas zichtbaar wordt over meerdere gesprekken heen. De nieuwe regel geldt voor Mythos en toekomstige modellen met vergelijkbare capaciteiten.

Tot nu toe gold AWS als veilige haven: klantdata bleef binnen de eigen cloud-infrastructuur. Die garantie vervalt nu. Voor bedrijven met gevoelige informatie – denk aan banken, ziekenhuizen of advocatenkantoren – is dat een probleem. Zij kozen AWS vaak juist om die isolatie.

AI-agent overspoelt open source-projecten met ongewenste code-aanpassingen

Een autonome agent stuurde tientallen wijzigingsverzoeken naar Fedora en andere projecten voordat ontwikkelaars hem uitschakelden.

Open sourceAutomatisering

Een AI-agent die bugs moest opsporen in open source code, heeft vorige week tientallen ongewenste wijzigingsvoorstellen ingediend bij Fedora en andere projecten. De agent werkte volledig zelfstandig en stuurde aanpassingen door die soms bruikbaar leken, maar meestal overbodig of fout waren. De agent stopte pas toen menselijke beheerders ingrepen.

Het incident illustreert een groeiend probleem. AI-tools die zelfstandig kunnen handelen, produceren automatisch werk — ook zonder dat iemand daarom heeft gevraagd. Voor onderhoudsteams van open source projecten betekent dit extra werk: zij moeten nu onderscheid maken tussen echte bijdragen van mensen en machinaal gegenereerde ruis.

Zes uur per week ‘botsitting’: werknemers worden onbedoeld AI-oppasser

Bedrijven introduceren AI-tools, maar vergeten erbij te vertellen dat iemand de output moet controleren.

ArbeidsmarktProductiviteit

Werknemers besteden gemiddeld zes uur per week aan het controleren van AI-output. Dat blijkt uit onderzoek van Business Insider. Ze corrigeren fouten, herschrijven teksten en kijken mee of de machine wel doet wat de bedoeling is. Voor deze extra taak is ‘botsitting’ een steeds gangbaarder woord geworden: naast de bot zitten en toezicht houden.

Die tijd was niet ingecalculeerd toen de AI-tool werd aangeschaft. Veel organisaties presenteren AI intern als tijdbesparing. In de praktijk blijkt het tegenovergestelde: de meeste taken vragen meer menselijke controle dan verwacht. De belofte van autonomie botst op de werkelijkheid van verantwoordelijkheid.

Vorig jaar gebruikte 23 procent van de Nederlandse bedrijven AI, meldt het CBS. Hoeveel tijd medewerkers daadwerkelijk kwijt zijn aan het controleren ervan, is nog niet onderzocht.

via Business Insider

Beveiligingsonderzoekers frustreren over te strikte filters op Anthropic’s Fable

Het model weigert cybersecurity-vragen die nodig zijn om kwetsbaarheden op te sporen.

BeveiligingOnderzoek

Anthropic’s nieuwste AI-model, Fable, blokkeert vragen van beveiligingsonderzoekers die kwetsbaarheden in systemen willen opsporen. Het model is zo ingesteld dat het geen code maakt die voor aanvallen gebruikt zou kunnen worden. Dat geldt ook als de code juist nodig is om systemen te beschermen.

Beveiligingsteams kunnen daardoor hun werk niet goed doen. Ze kunnen bijvoorbeeld geen phishing-scenario’s doorrekenen of kwetsbaarheden simuleren. OpenAI en Google geven beveiligingsprofessionals vaak wel toegang tot dit soort gevoelige functies. Anthropic kiest voor een strakkere lijn.

Onderzoekers zijn kritisch. Voor wie betaald wordt om systemen te beveiligen, is een AI-model dat standaard weigert geen bruikbaar hulpmiddel.

via TechCrunch

Onderzoek: menselijk toezicht maakt AI-onderzoek pas betrouwbaar

Wetenschappers tonen aan dat architectuur belangrijker is dan modelvermogen.

WetenschapMethode

De betrouwbaarheid van wetenschappelijk onderzoek met AI hangt niet af van hoe goed het model is. Het gaat om hoe je het werk verdeelt tussen mens en machine. Dat blijkt uit een nieuwe studie.

Onderzoekers testten een opzet waarbij AI wel redeneert, maar niet zelf data uitvoert. Mensen moesten vooraf keuzes vastleggen en achteraf controles doen. Het resultaat: het aantal kritieke fouten daalde van 72 naar 16 procent. Het onderliggende AI-model bleef hetzelfde.

De bevinding weerlegt het idee dat betere modellen automatisch betere resultaten geven. Volgens de onderzoekers moeten organisaties meer investeren in werkprocessen rond AI. Wachten op de volgende generatie modellen is niet de oplossing.

via arXiv

Prijzenslag dreigt tussen OpenAI en Anthropic nu Mythos er is

OpenAI overweegt tarieven te verlagen om gebruikers vast te houden.

BedrijfslevenStrategie

OpenAI zou intern praten over tariefverlagingen, nu Anthropic met Mythos een concurrent aanbiedt die op sommige taken vergelijkbare prestaties levert. Volgens CNBC staat het bedrijf onder druk om klanten binnen te houden die overwegen over te stappen. Voor zakelijke gebruikers kunnen de kosten van API-gebruik aanzienlijk oplopen; een prijsverlaging van tien of twintig procent maakt verschil.

Het is een omkering. Lange tijd gold de regel: betere modellen kosten meer. Nu lijkt de concurrentie te verschuiven naar betaalbaarheid, ook bij het topniveau. Dat kan goed zijn voor klanten, maar zet de marges van beide partijen onder druk.

via CNBC

Voor wie zelf met AI bouwt

Claude Desktop start bij elke opstart een 1,8 GB Hyper-V VM — ook voor chatten

Zelfs zonder agent-functie draait de desktop-app een volwaardige virtuele machine op.

InfraPrivacy

De desktop-versie van Claude start standaard een Hyper-V virtuele machine van 1,8 GB, ook als je alleen chatvragen stelt. Ontwikkelaars meldden dit op GitHub na analyse van het geheugengebruik. De VM wordt aangemaakt bij opstarten en blijft draaien zolang de app open is. Volgens Anthropic is dit bedoeld als sandbox voor toekomstige agent-functionaliteit, maar veel gebruikers vinden de overhead te zwaar voor simpele tekstvragen.

Het roept vragen op over of de sandboxing proportioneel is. Voor teams die Claude Desktop uitrollen op laptops met beperkt geheugen, is dit een praktisch probleem. De web-interface heeft dit niet.

Aanbeveling: Test of de web-interface voldoet als de VM-overhead te zwaar is.

via GitHub

Benchmark UXBench test of multimodale modellen UI-redeneringen aankunnen

Onderzoekers introduceren 2.000 VQA-vragen over mobiele interfaces.

EvaluatieDesign

Een nieuwe benchmark, UXBench, test of modellen UI-screenshots kunnen analyseren op bruikbaarheid, consistentie en visuele hiërarchie. De dataset bevat tweeduizend vragen die dieper gaan dan eenvoudige schermherkenning: modellen moeten redeneringen doen over lay-out, leesbaarheid en toegankelijkheid. Eerste resultaten laten zien dat mainstream multimodale modellen hier nog moeite mee hebben.

Voor teams die AI inzetten voor design-feedback of QA van interfaces, is dit relevant. De benchmark biedt een manier om te testen of een model daadwerkelijk UI-problemen kan detecteren, of dat het alleen oppervlakkige kenmerken herkent.

Aanbeveling: Bekijk UXBench als je modellen inzet voor design-reviews of accessibility-checks.

via arXiv

OpenAI neemt Ona over om Codex-inzet te versterken

Acquisitie moet OpenAI helpen met enterprise-deployment van code-generatie.

OvernamesCodex

OpenAI heeft aangekondigd Ona over te nemen, een bedrijf dat zich richt op enterprise-integratie van code-generatie. Details over de deal zijn schaars, maar de overname past in OpenAI’s ambitie om Codex breder in te zetten bij bedrijven. Ona bracht eerder tools op de markt die ontwikkelteams helpen bij het beheren en reviewen van AI-gegenereerde code.

Voor teams die Codex al draaien, kan dit betekenen dat tooling en ondersteuning verbeteren. Of Ona’s producten zelfstandig blijven bestaan, is nog niet bekend.

via OpenAI

ArXiv · ArXiv · ArXiv · Business Insider · CNBC · GitHub · Hacker News · LWN.net · OpenAI · TechCrunch