De belofte is dit jaar niet aan te slepen: AI gaat van chatbot naar agent, van antwoorden naar dóén. Er zit waarheid in. Maar juni 2026 laat twee dingen tegelijk zien. Er draaien nu agents die echt werk afmaken, en tegelijk is de eerste serieuze afkoeling van de hype begonnen. De vraag die je je vandaag mag stellen voor je een agent op een proces loslaat: levert het écht iets op, of kost het vooral tijd en geld?
Eerst even: wat een agent anders maakt
Een chatbot reageert op één vraag en stopt. Een agent krijgt een doel en blijft handelen tot het af is: hij knipt het op in stappen, gebruikt tools, leest data uit je apps en corrigeert zichzelf onderweg. Dat verschil klinkt klein, maar het verschuift wie het werk doet. Jij geeft de opdracht; de agent loopt de stappen.
Beginner-tip:Verwar een agent niet met een “slimmere chatbot”. Wil je het complete overzicht (de vier soorten agents, hun risico’s en wanneer je er een inzet), begin dan bij onze pillarAI-agents in 2026: wat zijn ze en wat kun je er echt mee?.
Het werk dat agents nu echt doen
Het zijn al lang geen demo’s meer. Notion 3.2 verscheen eind mei, met agents die tot twintig minuten zelfstandig aan een doel werken en meekijken in je Slack, Drive en Jira (Bron: TechCrunch). En deze week, op Build 2026 (2 juni), toonde Microsoft Scout: een always-on agent die continu op de achtergrond draait in Microsoft 365, vergadertijden plant en stukken voorbereidt zonder dat je telkens een prompt tikt (Bron: Microsoft 365 Blog).
Twee thema’s domineren het veld. Het eerste is computer-use: agents die zelf je browser of desktop bedienen in plaats van alleen tekst te produceren. Het tweede is multi-agent: meerdere agents die samen één klus klaren. We schreven eerder al dat het chatvenster langzaam verdwijnt, en Notion en Scout zijn precies dat patroon, nu in producten die je morgen kunt gebruiken.
Maar levert het op? De ongemakkelijke cijfers
Hier wordt het interessant, want naast de demo’s staat een stapel nuchtere data. Gartner verwacht dat meer dan 40% van alle agentic-AI-projecten vóór eind 2027 wordt geschrapt, door oplopende kosten, onduidelijke zakelijke waarde of onvoldoende risicocontrole (Bron: Gartner). MIT keek breder naar generatieve AI en vond dat ongeveer 95% van de bedrijfspilots niet opschaalt naar productie (Bron: Fortune). Eind mei 2026 deed Gartner er nog een schep bovenop: ook agents die wél in productie draaien worden vaak weer teruggeschroefd. Waarom dat gebeurt lees je in Gartner: 40% van de bedrijven zet zijn AI-agents vóór 2027 weer op een lager pitje.
Het scherpste cijfer komt van onderzoeksbureau METR. In een gecontroleerde proef lieten zij zestien ervaren open-source-ontwikkelaars 246 taken doen, de helft mét AI-tools (Cursor Pro, Claude 3.5/3.7), de helft zonder. Het verwachte resultaat was tijdwinst. De uitkomst: de ontwikkelaars deden er mét AI 19% langer over, terwijl ze achteraf dachten 20% sneller te zijn geweest (Bron: METR). Dat ging om coding-tools in plaats van agents, maar het patroon is precies wat je bij autonome systemen wilt vermijden: een gevoel van versnelling dat de meting niet haalt.
Die nuchterheid leeft ook buiten de rapporten. In de praktijk lopen mensen tegen agents aan die vastlopen, dubbel werk maken of dure omwegen nemen, een geluid dat je breed terugziet op X:
Daar komt “agent washing” bovenop. Leveranciers plakken een agent-sticker op bestaande chatbots, assistenten en RPA-scripts zonder dat er echte zelfstandigheid bij zit. Van de duizenden partijen die zich agentic noemen, telt Gartner er ongeveer 130 als de echte. De vraag bij elke demo is dus simpel: wat doet dit ding autonoom, en wat niet?
Tegenover die nuchtere cijfers staan wél bedrijven die het laten werken — niet met grootse agents, maar met één afgebakende taak. In AI use cases in het MKB: vier Nederlandse bedrijven die het echt doen zie je hoe een bakker, een metaalbewerker en een huisarts precies dat aanpakten.
Wat het kost: tokens, abonnementen en verborgen integratie
De rekening valt grofweg in twee vormen. Bij open-source frameworks is de software gratis, maar betaal je per LLM-token; een agent die veel stappen zet, stookt dus stevig door. Bij kant-en-klare tools betaal je een abonnement plus usage-limits. Daar bovenop komt het werk dat zelden in de prijs staat: koppelen aan je eigen systemen, testen, en het toezicht dat je erbij moet organiseren. Het verbruiksmodel rukt intussen ook op bij gevestigde tools: GitHub Copilot rekent sinds 1 juni af per token.
Ter oriëntatie, het landschap in juni 2026 (prijzen indicatief, meestal in dollars, exclusief intensief tokengebruik):
| Tool / platform | Type | Prijsindicatie (2026) | Belangrijkste beperking |
|---|---|---|---|
| Microsoft Copilot (M365) | Grote speler, kant-en-klaar | ~$21–30 p/user/mnd + M365 | Sterk binnen Microsoft, stug daarbuiten |
| Gemini Spark | Grote speler, 24/7 agent | in AI Ultra ~$100/mnd | Nog in uitrol (vaak US-first), toezicht nodig |
| Claude (Desktop + Computer Use) | Grote speler, sterk redeneren | Pro $20, Max $100–200/mnd | Rate limits; computer-use nog niet waterdicht |
| ChatGPT / OpenAI Agents | Grote speler, breed | Plus $20, zwaar gebruik tot ~$200/mnd | Kan hallucineren bij autonome acties |
| Manus | Autonome cloud-agent | gratis (beperkt) tot ~$200/mnd, credits | Credits onvoorspelbaar; rechten output soms grijs |
| LangGraph | Framework (open source) | gratis; je betaalt LLM-tokens | Steile leercurve |
| n8n | Low-code automatisering | gratis self-hosted; cloud ~€29/mnd | Minder “intelligent” zonder tuning |
| Lindy / Gumloop / Relay | No-code agents | ~$10–50/mnd | Zwak bij zeer complexe taken |
Gevorderden:Bij frameworks zit je kost in tokens, bij tools in abonnement plus limits. Een always-on agent die de hele dag meedraait, kan in tokens duurder uitvallen dan het maandbedrag doet vermoeden. Grote spelers winnen nu vooral op integratie en betrouwbaarheid, frameworks op maatwerk. Reken bij elke keuze het tokengebruik van een drukke dag door, niet dat van een demo.
Wat dit voor jou betekent
Afwachten is zonde, groots uitpakken te vroeg. Kies dus één afgebakende, herhaalbare taak waarvan je het goede resultaat herkent: inbox-triage, een vaste wekelijkse rapportage, offertes klaarzetten. Houd een menselijke goedkeuring op alles wat geld, data of klanten raakt, want autonomie betekent ook dat een fout vanzelf doorloopt. Meet daarna twee dingen eerlijk: hoeveel tijd je echt bespaart, en hoe vaak de agent eringaat.
Klopt dat plaatje, dan schaal je op. Klopt het niet, dan hoor je bij de 40% die er beter mee stopt, en dat is geen verlies maar bespaarde moeite. Welke vijf taken vandaag al betrouwbaar lukken, lopen we stap voor stap door in AI-agents in de praktijk: 5 taken die je deze week kunt automatiseren. En twijfel je tussen Notion, Scout, Manus of Claude Cowork, vergelijk ze dan eerst in AI-computer-agents en -tools vergeleken.
Samenvatting — de 5-minuten-versie
- Het kernverschil: een chatbot beantwoordt één vraag, een agent neemt een doel aan en werkt door tot het af is.
- Er draaien echte agents: Notion 3.2 (tot 20 min zelfstandig) en Microsoft Scout (always-on in Microsoft 365, aangekondigd 2 juni).
- De cijfers zijn nuchter: Gartner ziet 40% van de agentic-projecten sneuvelen, MIT meldt dat 95% van de GenAI-pilots niet opschaalt.
- METR mat dat ervaren ontwikkelaars 19% trager waren mét AI terwijl ze 20% sneller dachten te zijn; die perceptiekloof is het echte risico.
- Kosten zitten in tokens of in abonnement plus limits. Begin klein, houd een mens op gevoelige acties, meet het resultaat, en schaal pas daarna op.
Bronnen
- Gartner — Over 40% of Agentic AI Projects Will Be Canceled by End of 2027
- METR — Measuring the Impact of Early-2025 AI on Experienced Developer Productivity
- Fortune — MIT report: 95% of generative AI pilots at companies are failing
- Microsoft 365 Blog — Introducing Microsoft Scout
- Gartner — Hype Cycle for Agentic AI 2026