AI Ethiek 8 min

AI-hallucinaties in wetenschappelijke literatuur (2026)

Een audit van 2,5 miljoen papers vond bijna 147.000 verzonnen citaties uit AI. Wat het betekent voor je vertrouwen in onderzoek.

Miniatuur diorama-illustratie bij artikel 'AI-hallucinaties sluipen wetenschappelijke literatuur binnen — en blijven daar'

De cijfers die de wetenschap moet erkennen

Een audit van 2,5 miljoen wetenschappelijke papers identificeerde ongeveer 146.900 AI-gegenereerde fake citaties in 2025 alleen (Bron: Phys.org). De groei-curve is steiler dan iemand ooit verwachtte:

  • 2023: 1 op 2.828 papers bevatte een hallucinated referentie
  • 2025: 1 op 458 papers (zesvoudige toename in twee jaar)
  • Begin 2026 (eerste zeven weken): 1 op 277 papers

Dat is geen randverschijnsel. Dat is een structurele kwaliteitsdaling in de wetenschappelijke literatuur binnen een tijdsbestek van drie jaar. En het gaat niet alleen om obscure tijdschriften.

Beginner-tip:Heb je geen wetenschappelijke achtergrond? Geen probleem — dit raakt ook journalistiek, juridisch werk, beleidsanalyse en elk vak waar je op bronnen leunt die je niet zelf gecontroleerd hebt. Lees onzebredere gids over AI-hallucinaties herkennenvoor de algemene principes; dit stuk gaat over hoe het in onderzoekswerk concreet zit.

NeurIPS, ICLR en de top-tijdschriften

Het probleem is niet beperkt tot tweederangs-publicaties. Twee opmerkelijke vondsten uit 2026 (Bron: GPTZero):

NeurIPS 2025 (een van de prestigieuze AI-conferenties wereldwijd) had 53 papers die hallucinated citaties bevatten — ongeveer 1% van alle geaccepteerde papers. De studie analyseerde 100 specifieke verzonnen citaten die door de peer-review-pijplijn gleden.

ICLR 2026 (vergelijkbaar topnivo) had bij review 50 submissions met minstens één duidelijke hallucinatie. Elk van deze submissions was reeds door 3 tot 5 peer-experts beoordeeld — de meesten van hen misten het.

Met andere woorden: drie tot vijf experts per paper, top-tijdschrift, en de fake citaten kwamen er gewoon doorheen. Dit is geen kwestie van onverschilligheid of slechte review; het is een teken dat het onderscheid tussen echte en AI-gegenereerde citaten visueel moeilijk is geworden.

Hoe een hallucinated citaat eruitziet

Een voorbeeld om concreet te maken wat de uitdaging is. Een paper kan beweren:

“Recent work suggests that LLM-generated text contains 12% more hedging phrases than human-written text (Vermeulen & van Dijk, 2024).”

De auteurs Vermeulen en Van Dijk bestaan. Ze publiceren in dit domein. De vorm van de citatie klopt. Het tijdschrift heet plausibel. Maar het artikel zelf bestaat niet — of het bestaat wel, maar zegt iets heel anders, of het bestaat in een ander jaar.

Drie soorten hallucinaties zien we het meest:

  1. Volledig verzonnen — auteurs, titel en publicatie bestaan geen van drie
  2. Hybride — echte auteurs, verzonnen titel
  3. Mis-attribuut — bestaande artikel met verkeerde claim erbij geplakt

Voor wie even verder kijkt is dit detecteerbaar (Google Scholar, CrossRef-search). Voor wie scant en doorgaat, niet.

The Lancet-studie en de medische component

In mei 2026 publiceerde The Lancet een eigen analyse die de versnelling in medische literatuur kwantificeerde (Bron: STAT News). De zorg in deze sector is bijzonder omdat:

  • Medische claims worden vaak overgenomen in klinische richtlijnen
  • Klinische richtlijnen beïnvloeden directe patiëntenzorg
  • Een hallucinated citaat over een “trial” die niet bestaat kan medische beslissingen kleuren

Voor verloskundigen, artsen, apothekers en klinisch onderzoekers betekent dit dat citatie-verificatie nu professionele standaard moet zijn, niet langer optionele zorgvuldigheid. Voor wie het bredere context wil over hoe AI in de zorg landt: onze stuk over Microsoft Copilot for Health raakt vergelijkbare governance-vragen.

De distributie verbaast

De hallucinaties verspreiden zich niet random (Bron: ScienceDirect-analyse):

  • Disproportioneel toegeschreven aan prominente onderzoekers — AI-modellen kennen de namen van veel-geciteerde mensen en gebruiken die
  • Disproportioneel mannelijk — weerspiegelt waarschijnlijk de scheve verdeling in trainings-data
  • Meest in early-career-researchers en kleine teams — minder grondige interne review-cyclus

Dat laatste punt heeft een opmerkelijke implicatie: hallucinaties zijn niet altijd opzettelijke fraude. Veel auteurs schrijven met AI-hulp en checken niet elke bron. Dat is geen ontschuldiging, maar wel context: het probleem zit deels in een tool-gebruik-discipline-vacuüm, niet alleen in slechte intenties.

Gevorderden:De interessante onderzoeksvraag onder dit alles is hoecompoundingwerkt in citatie-netwerken. Een hallucinated citaat in paper A wordt overgenomen door paper B (die het origineel niet checkt), en die wordt op zijn beurt geciteerd in paper C. Tegen de tijd dat onderzoekers achter de oorspronkelijke fout komen, is de fictionele claim al onderdeel geworden van het wetenschappelijke discours. Dit is precies hoe verkeerde feiten in eerdere decennia ook zich verspreidden — alleen nu in versnelde vorm. Deanalyse over onze eigen omgang met informatiebronnenraakt deze laag.

Wat dit voor Nederlandse organisaties betekent

Drie groepen worden direct geraakt.

Onderzoekers en academici. Verifieer elke citaat in jouw eigen werk voor publicatie. Tools zoals Zotero met CrossRef-koppeling, of een specifieke AI-citaat-verifier zoals GPTZero. Reken op een halve dag per paper extra werk; het is dat waard.

Journalisten en redacties. Als je een wetenschappelijk artikel citeert voor je publiek, check niet alleen het artikel zelf maar ook drie of vier van zijn key-citaties. Een onderzoek dat leunt op hallucinated bronnen is fundamenteel ongeloofwaardig.

Beleidsmakers en juristen. Klinische richtlijnen, beleidsadviezen, juridische memoranda — overal waar onderzoek geciteerd wordt om beleid te onderbouwen, hoort dezelfde verificatie-discipline. De governance-stappen onder de EU AI Act raken dit niet direct, maar de bredere zorg over AI-output-betrouwbaarheid is hetzelfde.

Voor wie het breder wil kaderen: dit is de andere kant van Karpathy’s LLM Wiki-aanpak. De Wiki schrijft alleen vanuit bronnen die jij hebt aangedragen — een gedisciplineerde versie. Maar als je AI gebruikt zonder die discipline, krijg je dezelfde hallucinaties die nu in academic literature opduiken.

Hoe je vandaag een check-routine opzet

Stap 1. Bij elk paper of essay dat je publiceert: pak de drie meest impactvolle citaten en klik door. Bestaat het artikel? Klopt de claim?

Stap 2. Voor de overige citaten: een snelle CrossRef-check (gratis API, ook beschikbaar via Zotero). Geen hit = onderzoek doen.

Stap 3. Als je AI gebruikt bij het schrijven of samenvatten: laat AI nooit citaties genereren. Laat AI tekst genereren rond citaten die jij zelf hebt geverifieerd. Dat klinkt rigide maar is in 2026 de enige veilige route.

Samenvatting — de 5-minuten-versie

  • Een audit van 2,5 miljoen papers vond ongeveer 146.900 AI-gegenereerde fake citaties in 2025 — zesvoudig meer dan twee jaar eerder.
  • Het probleem treft top-publicaties: 53 papers in NeurIPS 2025 en 50 ICLR 2026 submissions bevatten verzonnen citaten ondanks peer-review.
  • Hallucinaties verspreiden zich niet random — disproportioneel onder prominente onderzoekers, in medische literatuur en bij early-career teams.
  • De grootste schade zit in stille verspreiding: een fake citaat dat 50 keer wordt overgenomen, wordt feitelijk waar voor lezers die niet doorklikken.
  • Voor wie professioneel met onderzoek werkt: citaat-verificatie is in 2026 geen paranoia maar standaard zorgvuldigheid — laat AI nooit citaten verzinnen.

Bronnen

Veelgestelde vragen

Wat is een AI-hallucinated citaat precies?

Een citaat van een artikel of boek dat niet bestaat. AI-modellen weten dat citaties een bepaalde vorm hebben (auteur, jaar, tijdschrift, paginanummers) en kunnen die vorm overtuigend nabouwen — inclusief auteursnamen die wel echt zijn maar het artikel nooit hebben geschreven. Voor een lezer ziet het er identiek uit aan een echte bronvermelding.

Hoe komt het dat peer-reviewers dit missen?

Twee redenen. Eén: peer-reviewers krijgen vaak weinig tijd per paper en checken zelden alle bronnen. Twee: hallucinated citaties bevatten echte auteursnamen en geloofwaardige titels — zonder te klikken naar het origineel zien ze er niet verdacht uit. Een GPTZero-studie scande 300 ICLR-submissions: 50 bevatten fake citaten, ondanks dat elk al door 3-5 peer-experts was beoordeeld.

In welke vakgebieden komt het het meest voor?

Volgens recente data: medisch, sociale wetenschappen en AI-onderzoek zelf zijn het zwaarst getroffen. The Lancet publiceerde mei 2026 een studie die laat zien dat het probleem in medische literatuur — waar verkeerde bronnen direct levens kunnen kosten — sterk versnelt. Een citaat over een 'klinische trial' die niet bestaat heeft een heel andere impact dan een verzonnen verwijzing in een filosofie-paper.

Welke tools helpen om hallucinated citaties te detecteren?

Drie categorieën: (1) automatische verifiers zoals GPTZero die specifiek scannen op fake citaties; (2) handmatige checks met Google Scholar of bronnen-databases als CrossRef — elke citaat die niet vindbaar is, is verdacht; (3) AI-tools die jouw paper checken voor publicatie — sommige uitgevers bieden dit nu standaard aan. Zie ook onze eigen [gids over AI-hallucinaties herkennen](/tutorials/ai-hallucinaties-herkennen) voor de algemene aanpak.

Wat kan je als lezer doen?

Als je iets leest dat een specifieke claim onderbouwt met een bron, en die bron is voor jou belangrijk: klik door of zoek het op. Als de bron niet bestaat of niet zegt wat het paper beweert, is dat een rode vlag. Voor wie professioneel met onderzoek werkt (journalisten, beleidsmakers, juristen): leg deze discipline vast als standaard, niet als optionele extra.

Bronnen

Waar deze informatie vandaan komt.

  1. Phys.orgphys.org
  2. GPTZerogptzero.me
  3. STAT Newsstatnews.com
  4. ScienceDirect-analysesciencedirect.com