Open-source AI bereikt een keerpunt
In 2026 is de drempel voor state-of-the-art AI ingestort. Open-source modellen bestrijken nu elk domein: tekstgeneratie, beeldcreatie, audio, programmeren en meer. Wat ooit alleen beschikbaar was via dure technische koppelingen van OpenAI of Google, is nu gratis te downloaden en op je eigen computer te draaien (Bron: MuleAI — Open-Source Models 2026).
De drie grote families die het landschap domineren: Meta’s Llama, Mistral AI en DeepSeek.
Voor wie is dit artikel?Voor professionals, techneuten en nieuwsgierige lezers die willen weten welke open-source AI-modellen er bestaan en wat de verschillen zijn. Ik ga hier iets dieper op techniek dan in onze gewone nieuws-artikelen — “tokens”, “parameters” en “quantisatie” komen voor, maar elke term leg ik bij eerste gebruik uit. Ben je helemaal nieuw met AI? Begin dan metChatGPT voor beginnersvoordat je je op open-source stort.
📌 Let op: dit artikel is laatst bijgewerkt op 20 mei 2026. Het landschap beweegt razendsnel — sinds de oorspronkelijke versie van februari heeft DeepSeek V3.2 (eind 2025, 94,2% MMLU) en V4 (Compressed Sparse Attention, KV-cache 10% van V3.2 bij 1M tokens) uitgebracht, en Meta is met Llama 4 (Scout + Maverick) — multimodaal en MoE — gekomen. De grote thema’s en architectuur-uitleg in dit stuk blijven van toepassing.
Beginner-tip:“Open-source” betekent strikt gezien dat naast de modelgewichten ook trainingscode en -data open zijn. In de praktijk noemen veel mensen — en wij in dit artikel ook — modellen als Llama “open-source” terwijl ze technisch “open weight” zijn (gewichten vrij downloadbaar, code en data niet). Het belangrijkste verschil met closed-source: je kunt het model op je eigen computer draaien, fine-tunen, en in je producten inbouwen — vaak zonder kosten.
De grote drie
Meta’s Llama 4 — De multimodale standaard
Meta’s Llama-familie is de meest gebruikte open-weight LLM ter wereld — met meer dan 3 miljard gebruikers van afgeleide producten. Op 5 april 2025 introduceerde Meta de Llama 4 herd (Bron: Meta AI — Llama 4 announcement): de eerste natively multimodale, MoE-gebaseerde versies. Twee modellen kwamen direct uit; een derde (Behemoth) was als teacher-model in training. Per mei 2026 zijn Behemoth-gewichten nog niet publiek uitgebracht.
| Model | Totaal / actief | Experts | Context | RAM-richtwaarde | Sterke punt |
|---|---|---|---|---|---|
| Llama 4 Scout | 109B / 17B actief | 16 | 10M tokens | 64 GB (Q4) | Lange context op consumer-hardware |
| Llama 4 Maverick | ~400B / 17B actief | 128 | 1M tokens | 256+ GB | Vlaggenschip-MoE |
| Llama 4 Behemoth | ~2T / 288B actief | 16 | — | Cloud-only | Nog in training (mei 2026) |
| Llama 3.3 8B | 8B dense | — | 128K | 8 GB | Lichtgewicht klassieker |
Licentie: Meta Llama License — commercieel gebruik toegestaan, met beperkingen op misbruik en op héél grote inzet (>700M gebruikers). Geen volledig open-source (Apache/MIT), maar breed genoeg voor de meeste mkb-toepassingen.
# Direct draaien via Ollama
ollama run llama3.3:8b # Compact, voor 8GB+ RAM
ollama run llama4-scout # MoE, 10M context, vanaf 64GB
Gevorderden:De Maverick-variant draait niet op consumer-hardware — reken op multi-GPU server-setups of cloud. Op Apple Silicon (M3 Ultra 256 GB) kun je Llama 4 Scout draaien met Q4 quantisatie en bijna alle context-window benutten. Voor productietoepassingen waar 1M context geen vereiste is, is Llama 3.3 70B in Q4/Q5 nog steeds een prima sweet spot.
Mistral AI — De Europese uitdager
Het Franse Mistral AI combineert open-source modellen met commerciële producten. Hun Mistral Small 3 (24B) levert prestaties vergelijkbaar met 70B-modellen — maar 3x sneller (Bron: O-mega.ai / Simon Willison Analysis). Zelf test ik Mistral graag op Europese teksten — de taalbeheersing in Frans en Duits voel ik duidelijk beter dan bij veel Amerikaanse varianten, wat op zich logisch is gezien de herkomst.
| Model | Parameters | Architectuur | Licentie | Sterke punt |
|---|---|---|---|---|
| Mistral 7B v0.3 | 7B | Dense | Apache 2.0 | Snelheid, laagdrempelig |
| Mistral Small 3 | 24B | Dense | Apache 2.0 | 70B-prestaties, 3x sneller |
| Mixtral 8x22B | 141B (39B actief) | MoE | Research | MoE-architectuur |
| Mistral Large | 123B | Dense | Commercieel | Vlaggenschip |
Opvallend: Mistral Small 3 is Apache 2.0 gelicenseerd — volledig vrij voor commercieel gebruik, aanpassen en distribueren. Dit was een bewuste stap na eerdere restrictievere licenties.
ollama run mistral # 7B - snel en compact
ollama run mistral-small:24b # 24B - beste prijs-kwaliteit
Beginner-tip:Mistral is een Frans bedrijf — een zeldzaamheid in het door Amerika gedomineerde AI-landschap. Hun modellen zijn populair in Europa, mede doordat ze bewust kiezen voor open licenties die bedrijven rechtszekerheid geven.
DeepSeek — De Chinese disruptor die de top haalde
DeepSeek verraste de AI-wereld met hun Mixture-of-Experts (MoE) aanpak: modellen met honderden miljarden parameters die slechts een fractie activeren per token. Sinds eind 2025 is DeepSeek de top-open-source geworden — V3.2 evenaart GPT-4o op MMLU (94,2%) en haalt voorbij 80% op SWE-bench Verified, een SWE-benchmark waar veel closed-source modellen niet eens komen.
| Model | Totaal / actief | Architectuur | Sterke punt |
|---|---|---|---|
| DeepSeek V3 | 671B / 37B | MoE + MLA | Doorbraak eind 2024 |
| DeepSeek R1 | ~671B / 37B | MoE + reasoning | Wiskundig redeneren, evenaart o1 |
| DeepSeek R1-0528 | ~671B / 37B | Verbeterde reasoning | Mei 2025 — 2e op AIME na o3 |
| DeepSeek V3.2 | 671B / 37B | MoE + MLA + verbeterde training | Huidige top: 94,2% MMLU, ~1421 LMArena Elo |
| DeepSeek V4 | Nieuw | MoE + CSA + HCA | KV-cache cut naar 10% van V3.2 bij 1M tokens |
Het innovatieve: V4 introduceerde Compressed Sparse Attention (CSA) en Heavily Compressed Attention (HCA) — technieken die het geheugengebruik bij ultra-lange context drastisch verkleinen. Waar V3.2 al efficiënt was met Multi-Head Latent Attention (MLA, geheugen -93,3%), brengt V4 dat naar nog een orde van grootte verder bij miljoen-token gesprekken. (Bron: Codersera Open-Source LLM Landscape 2026)
De tradeoff: je hebt 256–512 GB RAM nodig om het model te laden. Dit maakt het onpraktisch voor lokaal gebruik, maar uitermate efficiënt op servers. Wie zelf wil hosten kan kijken naar GPU-cloud voor zelf hosten — onze vergelijking laat zien welke providers DeepSeek-formaten aankunnen en tegen welke uurprijzen.
Gevorderden:DeepSeek-V3 zou getraind zijn voor circa $5,6 miljoen tegenover ~$100M voor een vergelijkbare GPT-4-training. Of die cijfers zuiver vergelijkbaar zijn is een discussie op zich, maar zelfs een orde-van-grootte sneller-en-goedkoper hertraining wijst op een ander economisch model — interessant voor wie de discussie overAI-subsidie en stroomnetvolgt.
Meer open modellen om in de gaten te houden
| Model | Ontwikkelaar | Parameters | Licentie | Niche |
|---|---|---|---|---|
| Phi-4 14B | Microsoft | 14B | MIT | Beste kwaliteit voor grootte |
| Qwen 2.5 | Alibaba | 7B–72B | Apache 2.0 | Meertalig + code |
| Gemma 2 9B | 9B | Open | Research & creatief | |
| CodeLlama | Meta | 7B–70B | Llama License | Programmeren |
| Stable Diffusion 3 | Stability AI | N.v.t. | Open | Beeldgeneratie |
Open-source vs. closed-source in 2026
| Aspect | Open-source (Llama 4, Mistral, DeepSeek V3.2/V4) | Closed-source (GPT-5.5, Claude Opus 4.7) |
|---|---|---|
| Kosten | Gratis (hardware nodig) | $1,25–$30/1M tokens |
| Privacy | ✅ Data blijft lokaal | ⚠️ Data naar cloud |
| Kwaliteit | DeepSeek V3.2 ≈ GPT-4o; Llama 4 multimodaal | GPT-5.5 / Claude Opus 4.7 nog stevig voor |
| Aanpasbaarheid | ✅ Fine-tuning, LoRA, distillation | ❌ Alleen prompting |
| Context window | 128K–10M (Llama 4 Scout) | 128K–1M tokens |
| Multimodaal | ✅ Llama 4 (native), DeepSeek beperkt | ✅ Volledig (tekst/beeld/audio) |
| Ondersteuning | Community | Enterprise SLA |
Waarom het ertoe doet
Open-source AI is cruciaal om drie redenen:
- Democratisering: Bedrijven en onderzoekers hoeven niet afhankelijk te zijn van twee of drie Amerikaanse aanbieders. Ook in Nederland groeit het ecosysteem — van chipmaker Axelera AI tot nieuwe LLM-startups: Nederlandse AI-startups in 2026 geeft een actueel beeld van wie er meedoet
- Data-soevereiniteit: Essentieel voor Europese bedrijven onder GDPR en de EU AI Act
- Innovatie: De open-source community bouwt sneller dan welk bedrijf ook — LoRA, quantisatie, MoE-optimalisaties en open-source modellen voor RAG komen grotendeels uit de community
Beginner-tip:Wil je beginnen met open-source AI? Installeer Ollama (zie onze tutorial) en draai
ollama run llama3.3:8b. Binnen 5 minuten heb je een volledig lokale AI-assistent die vergelijkbaar is met ChatGPT van twee jaar geleden — gratis en volledig privé.