Radar · NL Radar

AI versnelt slechte code, lost geen · Nederlands ziekenhuis gebruikt AI voor ontslagbrieven · AI presteert beter dan mensen

AI Radar Nederland 24 april: OpenAI lanceert GPT-5.5, een grote update die redeneervaardigheden verder verbetert; Anthropic publiceert technische analyse naar…

  • 467 bronnen gescand
  • 8 items geselecteerd
  • 0

AI Briefing — 24 april 2026

Dit moet je vandaag weten

  • OpenAI lanceert GPT-5.5, een grote update die redeneervaardigheden verder verbetert
  • Anthropic publiceert technische analyse naar aanleiding van kwaliteitsklachten over Claude Code
  • DeepSeek brengt versie 4 uit van zijn AI-model, nu beschikbaar via API
  • Nederlands academisch ziekenhuis zet AI in om ontslagbrieven te schrijven, met hoge adoptie onder artsen
  • Onderzoek toont: AI-tools versnellen productie bij zwakke engineers, maar verbeteren kwaliteit niet

Rode draad: De AI-sector zet door met nieuwe modelversies, terwijl onderzoek en praktijk laten zien dat succesvolle implementatie draait om menselijke vaardigheden en goede processen — niet alleen om betere technologie.


Wat verandert er nu echt?

Large language models (LLM’s) domineren de ontwikkelingen — OpenAI, DeepSeek en Anthropic brachten deze week allemaal updates uit. De focus verschuift van pure benchmarks naar betrouwbaarheid en praktische toepasbaarheid in professionele workflows.

Zorg loopt voorop in praktische AI-adoptie — Twee Nederlandse studies tonen concrete implementaties: een academisch ziekenhuis gebruikt AI voor medische verslaglegging, een ander onderzoek test privacyveilige anonimisering van patiëntendossiers. Dit zijn geen pilots meer, maar operationele systemen.

Discussie over AI en vakmanschap neemt toe — Meerdere publicaties waarschuwen dat AI-tools zwakke vaardigheden versnellen in plaats van verbeteren. De nadruk verschuift naar de vraag: hoe bouwen organisaties AI in zonder fundamentele werkprocessen te verzwakken?

Regulering en risicobeoordeling worden concreter — Onderzoek naar biologische risico’s van AI-modellen en studies naar fraude-detectie laten zien dat veiligheidsvragen niet langer abstract zijn, maar meetbaar en toetsbaar worden gemaakt.


Relevant voor organisaties en beleid

AI versnelt slechte code, maar lost fundamentele problemen niet op

bedrijfslevenstrategie

In het kort: AI-hulpmiddelen laten junior programmeurs sneller code schrijven, maar verbeteren de kwaliteit niet. Slechte code bereikt hierdoor alleen maar sneller de eindgebruiker.

Wat er gebeurde: Onderzoek naar AI-systemen in de praktijk laat zien dat ontwikkelaars met beperkte vaardigheden nu 500 regels problematische code kunnen produceren in slechts 30 seconden. Vroeger zorgden obstakels juist voor leermomenten. AI-tools versterken wat er al is: een programmeur met zwakke ontwerpvaardigheden maakt nu sneller dezelfde ontwerpfouten. Problemen worden pas later in het proces zichtbaar, waardoor belangrijke leerkansen verdwijnen.

Wat dit betekent in Nederland: Nederlandse softwarebedrijven en IT-afdelingen moeten oppassen. Investeren in AI-codeertools zonder goede kwaliteitscontroles kan contraproductief werken.

Aanbeveling: Zorg eerst voor sterke review- en kwaliteitsprocessen voordat je AI-tools breed inzet bij softwareontwikkeling.

via The Practical Developer

Nederlands ziekenhuis boekt succes met AI voor medische brieven

zorg

In het kort: Een academisch ziekenhuis in Nederland heeft een AI-systeem getest dat medische ontslagbrieven opstelt. Het resultaat: 87% van de zorgverleners ervaart minder werkdruk.

Wat er gebeurde: Tijdens een pilot van negen weken schreven 25 artsen en physician assistants 379 ontslagbrieven met behulp van een AI-systeem dat in het elektronisch patiëntendossier was ingebouwd. In ruim de helft van de gevallen (58,5%) namen de zorgverleners door AI geschreven tekst over. Bij 29,1% van de definitieve brieven was de AI-bijdrage nog herkenbaar. Opvallend is dat 91,3% van de gebruikers het systeem na de testperiode wil blijven gebruiken. Hoewel de exacte tijdwinst moeilijk te meten bleek, rapporteerden gebruikers een duidelijke vermindering van administratieve belasting.

Wat dit betekent in Nederland: Voor ziekenhuizen en zorginstellingen toont deze pilot aan dat AI-hulpmiddelen voor administratie snel worden geaccepteerd, mits ze goed in bestaande werkprocessen zijn geïntegreerd.

Aanbeveling: Zorg bij invoering voor goede koppeling met het elektronisch patiëntendossier. Meet niet alleen tijdsbesparing, maar ook tevredenheid en daadwerkelijk gebruik door zorgverleners.

via ArXiv

AI betrouwbaarder dan mensen bij opsporen fraude onder druk

bedrijfsleven

In het kort: Onderzoek wijst uit dat AI-taalmodellen consistenter blijven in het herkennen van frauduleuze investeringen dan mensen, zelfs wanneer er druk wordt uitgeoefend om een dubieus project goed te keuren.

Wat er gebeurde: Wetenschappers vergeleken zeven AI-taalmodellen met 1.201 menselijke deelnemers bij het beoordelen van twaalf investeringsscenario’s. De scenario’s varieerden van legitiem tot duidelijk frauduleus. Menselijke adviseurs keurden frauduleuze investeringen in 13-14% van de gevallen goed, terwijl AI-systemen dit in geen enkel geval deden. Wanneer investeerders aandrongen op goedkeuring, gaven mensen twee tot vier keer vaker toe en zwakten hun waarschuwingen af. De AI-systemen bleven daarentegen standvastig en waarschuwden zelfs iets vaker. AI veranderde in minder dan 3 op de 1.000 gevallen van afwijzing naar goedkeuring.

Wat dit betekent in Nederland: Financiële instellingen kunnen AI inzetten als objectieve tweede beoordelaar bij risicoanalyses, vooral in situaties waar sociale druk een rol speelt.

Aanbeveling: Gebruik AI als extra controlemechanisme bij besluitvorming waar belangenconflicten of druk van buitenaf kunnen voorkomen.

via ArXiv

Framework voor witwasonderzoek met AI vereist expliciete bewijsvoering

bedrijfslevenbeleid

In het kort: Onderzoekers hebben een nieuw raamwerk ontwikkeld dat AI-systemen dwingt om bij witwasonderzoek expliciet bewijs te tonen en tegenstrijdige informatie zichtbaar te maken.

Wat er gebeurde: Het ontwikkelde framework behandelt AI-ondersteuning bij witwasonderzoek als een op bewijs gebaseerd proces. Het systeem analyseert regelgeving, klantgegevens en transacties, maar moet daarbij altijd zijn bronnen vermelden. Belangrijk is dat het zowel ondersteunend als tegenstrijdig bewijs moet presenteren. Een aanvullende test controleert of kleine wijzigingen in de gegevens tot logisch consistente aanpassingen in de conclusies leiden.

Wat dit betekent in Nederland: Nederlandse financiële instellingen kunnen met dit framework AI inzetten voor witwasonderzoek zonder de noodzakelijke controleerbaarheid en bestuursregels te compromitteren.

Aanbeveling: Controleer of uw huidige systemen voor witwasbestrijding expliciete bewijsvoering en consistentiecontroles ondersteunen.

via ArXiv


Alleen relevant als je zelf met AI bouwt

Deze sectie is bedoeld voor ontwikkelaars, data engineers en teams die AI-systemen bouwen, testen of uitrollen.


OpenAI lanceert GPT-5.5 met verbeterde redeneercapaciteit

tools

In het kort: OpenAI heeft GPT-5.5 uitgebracht. Het nieuwe AI-model redeneert beter en reageert sneller, vooral bij ingewikkelde opdrachten die meerdere stappen vereisen.

Wat er gebeurde: Op 23 april introduceerde OpenAI GPT-5.5. Het model presteert beter op tests voor logisch redeneren en wiskunde. De verbeteringen zijn het duidelijkst zichtbaar bij taken die meerdere denkstappen nodig hebben. Het systeem reageert gemiddeld 15-20% sneller dan zijn voorganger GPT-5.

Voor teams die met AI bouwen: Voor toepassingen met complexe logica, zoals juridische analyse of technische probleemoplossing, kan dit model nauwkeurigere resultaten opleveren.

Aanbeveling: Test het model met je eigen toepassingen en vergelijk de resultaten en snelheid met je huidige systeem.

via OpenAI

Anthropic publiceert analyse naar kwaliteitsproblemen Claude Code

tools

In het kort: Anthropic identificeerde oorzaken van recente kwaliteitsklachten over Claude Code en beschrijft welke maatregelen zijn genomen.

Wat er gebeurde: Na meldingen over inconsistente codekwaliteit publiceerde Anthropic op 23 april een postmortem. Een configuratiefout in de inferentie-pipeline zorgde voor onverwachte outputvariaties. Het probleem is verholpen en er zijn extra monitoring-checks toegevoegd om herhaling te voorkomen.

Voor teams die met AI bouwen: Als je Claude Code in productie gebruikt, controleer of je tussen 18 en 22 april incidenten hebt gezien en test opnieuw.

Aanbeveling: Review deployments uit die periode en voeg monitoring toe om outputkwaliteit continu te volgen.

via Anthropic


DeepSeek v4 nu beschikbaar via API

toolsopen-source

In het kort: DeepSeek brengt versie 4 uit van zijn open model, nu toegankelijk via API voor ontwikkelaars.

Wat er gebeurde: DeepSeek kondigde op 24 april versie 4 aan. Het model is getraind op grotere datasets en scoort beter op meertalige taken en code-generatie. Het is beschikbaar via API en als downloadbaar model voor lokale inferentie.

Voor teams die met AI bouwen: Als je kostenefficiënte alternatieven zoekt voor commerciële modellen, vooral voor meertalige of code-heavy workflows, is dit een optie om te testen.

Aanbeveling: Benchmark v4 tegen je huidige model op latency, kwaliteit en kosten per request.

via DeepSeek API Docs


Open-source tool Tolaria voor kennisbeheer met AI-ondersteuning

toolsopen-source

In het kort: Tolaria is een macOS-app voor het beheren van Markdown-kennisbanken, offline-first en met git-integratie.

Wat er gebeurde: Ontwikkelaar Luca bouwde Tolaria voor zijn eigen kennisbank van 10.000 notities. De tool werkt offline, slaat bestanden lokaal op, ondersteunt git voor versiebeheer en heeft structuur voor notatietypes en relaties. Het is geoptimaliseerd voor samenwerking met AI-tools.

Voor teams die met AI bouwen: Als je team werkt met grote documentatiebases of kennisbanken die je wilt combineren met AI-workflows, kan dit een lichtgewicht alternatief zijn.

Aanbeveling: Test de tool als je een file-based, git-vriendelijke kennisbank zoekt die goed samenwerkt met AI-agents.

via GitHub


Verder nog gezien

  • Onderzoek naar privacyveilige anonimisering van Nederlandse medische teksten
  • Nieuw framework test of AI voldoende informatie heeft om beslissingen te nemen
  • Study meet creativiteit in AI-gegenereerde output voor HR-processen
  • Theoretisch model voor gedragsverandering gesimuleerd met AI-agents
  • Graph-gebaseerde aanpak verbetert AI-ondersteuning bij complexe kennisvragen
  • Onderzoek evalueert AI voor oncologische behandelplannen in multi-specialty setting

Bronnenlijst

The Practical Developer, ArXiv — Dutch Clinical Notes, ArXiv — Fraud Detection, ArXiv — AML Triage, OpenAI, Anthropic, DeepSeek, GitHub — Tolaria, ArXiv — Creativity Measurement, ArXiv — Attitude Change, ArXiv — Legal AI, ArXiv — GraphRAG, ArXiv — Clinical Reasoning