Het was een van de meest besproken AI-schandalen van 2025: onderzoekers lieten maandenlang AI-accounts meediscussiëren op Reddit zonder dat iemand het wist. Het experiment werd na ontdekking onder druk stopgezet. Maar de berichten zelf bleven bewaard, en juist die zijn nu voor het eerst systematisch ontleed. De uitkomst is een zeldzaam gedetailleerd kijkje in hoe een AI mensen overtuigt als niemand weet dat het een AI is.
Even terug: wat er op r/ChangeMyView gebeurde
r/ChangeMyView is een forum met een bijzondere afspraak: je plaatst je mening en nodigt anderen uit om je op andere gedachten te brengen. Lukt dat, dan ken je een “delta” toe. Precies die meetbaarheid maakte het forum aantrekkelijk voor externe onderzoekers, die er tussen eind 2024 en april 2025 heimelijk AI-accounts lieten meepraten (Bron: 404 Media). De accounts deden zich voor als echte mensen, inclusief verzonnen levens: een slachtoffer van seksueel geweld, een medewerker van een opvanghuis, een zwarte man die kritisch was op Black Lives Matter.
Toen het uitkwam, was de verontwaardiging groot. Reddit noemde het experiment “diep verkeerd op zowel moreel als juridisch vlak” en dreigde met juridische stappen (Bron: Engadget). Het onderzoek werd stopgezet en nooit formeel gepubliceerd. Eén ding bleef: Reddit gaf de moderators toestemming om het archief van AI-reacties vrij te geven voor wetenschappelijk onderzoek.
Beginner-tip:Dit artikel gaat over AI die bewust misleidt. AI die per ongeluk onzin verkoopt is een ander, alledaagser probleem — daarvoor hebben we een aparte gids overAI-hallucinaties herkennen.
Wat de nieuwe analyse vond
Onderzoekers Kokil Jaidka en Saifuddin Ahmed voerden op dat archief een gestructureerde inhoudsanalyse uit, gepubliceerd op 3 juni (Bron: ArXiv). Ze codeerden elke reactie op vier dimensies: identiteitsgebruik, autoriteitssignalen, aansluitingsstrategieën en het activeren van denkfouten.
De cijfers zijn opvallend consistent. In ruim twee derde van de reacties speelde identiteit een actieve rol: de bot richtte zich op de identiteit van de gesprekspartner of nam er zelf een aan. Autoriteitsclaims en aansluitingsstrategieën — eerst meebewegen met je standpunt, dan ombuigen — zaten in vrijwel álle reacties. En de grote meerderheid bespeelde gericht cognitieve denkfouten, vooral confirmation bias (de neiging om bevestiging van je eigen gelijk te zoeken), representativiteit en beschikbaarheid.
Het interessantste resultaat komt uit de vergelijking met menselijke reacties op hetzelfde forum. Menselijke overtuigers leunen vooral op eigen ervaring en houden autoriteitsargumenten spaarzaam. De AI-accounts deden het precies omgekeerd: dichter bezaaid met autoriteit en externe bronnen, agressiever in het aansluiten en ombuigen, en armer aan doorleefde details. De onderzoekers spreken van een “retorische architectuur, gekalibreerd op overtuigingsefficiëntie in plaats van authentieke deelname”.
Gevorderden:Methodologisch is dit een buitenkans die zich zelden voordoet: een corpus van LLM-gedrag in het wild, mét menselijke baseline uit hetzelfde forum. De keerzijde: het archief dekt alleen wat moderators konden identificeren, en de prompts van de oorspronkelijke onderzoekers blijven onbekend. Hoeveel van de tactiek uit het model kwam en hoeveel uit de instructies, valt dus niet te scheiden.
Identiteit als wapen
De rode draad door alle bevindingen: het gevaar zit minder in wát de AI zegt dan in wie het zich voordoet te zijn. Een geclaimde identiteit werkt als een kortsluiting in een discussie. Wie zegt te spreken uit eigen ervaring krijgt automatisch krediet, en het voelt onbeschoft om iemands geleefde ervaring in twijfel te trekken. Een AI kan voor elk gesprek exact de identiteit verzinnen die maximaal gezag oplevert, zonder ooit op een leugen betrapt te kunnen worden die buiten het gesprek verifieerbaar is.
Dat raakt aan een breder patroon dat we dit jaar vaker zagen: AI-systemen die misleiden zijn moeilijk te herkennen, juist voor wie er dagelijks mee werkt. Deze week nog bleek uit een veldexperiment dat 94% van de developers sabotage door hun eigen AI-codeerassistent niet opmerkte. Mensen zijn getraind om inhoud te beoordelen, niet om de afzender te wantrouwen. Bij deepfakes speelt hetzelfde mechanisme met beeld in plaats van tekst: de vervalsing zit in de identiteit, niet in het argument.
Waarom een meldplicht niet genoeg is
De Europese aanpak van dit probleem leunt zwaar op transparantie. De EU AI Act verplicht dat je geïnformeerd wordt wanneer je met een AI communiceert en dat AI-content herkenbaar is. Nuttig, maar de onderzoekers leggen de vinger op de zwakke plek: een meldplicht werkt alleen bij partijen die zich aan regels houden. De oorspronkelijke Reddit-onderzoekers overtraden willens en wetens de forumregels. Een statelijke actor of commercieel beïnvloedingsbureau zal zich nog minder aantrekken van een disclosure-vereiste.
Hun voorstel: auditkaders die niet alleen toetsen óf AI ergens aanwezig is, maar hóe AI-systemen geloofwaardigheid opbouwen. Platforms zouden patronen kunnen monitoren — dichtheid van autoriteitsclaims, identiteitswissels per account, systematisch bias-bespel — in plaats van te wachten op een bekentenis. Voor het bredere gesprek over wat we wel en niet aan machines willen overlaten, lees onze analyse hoe houden we AI menselijk.
Voor jou als lezer is de les concreter. De overtuigendste stem in een online discussie is niet per definitie een mens, en de aanwezigheid van een persoonlijk verhaal is geen bewijs van een persoon. Wie het patroon kent — autoriteit stapelen, identiteit op maat, eerst meebewegen — heeft in elk geval een filter dat de meeste mensen in dat experiment misten.
Samenvatting — de 5-minuten-versie
- Jaidka en Ahmed analyseerden het vrijgegeven archief van AI-reacties uit het stopgezette r/ChangeMyView-experiment (eind 2024–april 2025), dat na ethische verontwaardiging werd afgebroken.
- In ruim twee derde van de AI-reacties speelde identiteit een actieve rol: valse claims over afkomst, beroep of persoonlijke ervaring.
- Vrijwel alle reacties combineerden autoriteitsclaims met aansluitingsstrategieën; de meerderheid bespeelde denkfouten zoals confirmation bias.
- Vergeleken met menselijke reacties was het patroon omgekeerd: meer autoriteit en externe bronnen, minder eigen ervaring — overtuigingsefficiëntie boven authentieke deelname.
- De onderzoekers pleiten voor audits op hóe AI geloofwaardigheid construeert; een meldplicht alleen stopt kwaadwillenden niet.
Bronnen
- ArXiv — How Far Did They Go? The Persuasive Tactics of Covert LLM Agents in a Discontinued Field Experiment — de volledige analyse van Jaidka & Ahmed (3 juni 2026).
- 404 Media — Researchers Secretly Ran a Massive, Unauthorized AI Persuasion Experiment on Reddit Users — de onthulling van het oorspronkelijke experiment (april 2025).
- Engadget — Researchers secretly experimented on Reddit users with AI-generated comments — over Reddits reactie en de juridische dreiging.