De AI Brief · week 23

De AI-euforie koelt af.

Verder deze week: open modellen worden bijna gratis, en 'sneller door AI' blijkt vaak meer gevoel dan winst.

2 jun 2026 · de hele week · door een mens, AI als gereedschap

Waar staan we

Deze week werd het gesprek over AI een stuk nuchterder. Mensen raken AI-moe. "Tired of Talking to AI" was het best gelezen stuk op Hacker News. DuckDuckGo kreeg 28% meer bezoek met een zoekmodus zonder AI. Zelfs de bazen van OpenAI en Anthropic trokken hun "AI pakt je baan"-voorspelling terug.

Bij bedrijven verschuift de vraag van "wat kan AI" naar "wat levert het op". Opus 4.8 werd het beste model om mee te programmeren. Tegelijk liet een groot onderzoek zien: ervaren programmeurs voelden zich 20% sneller met AI, maar waren 19% langzamer.

De rode draad: de techniek wordt spotgoedkoop, en steeds vaker draai je 'm gratis op je eigen machine. De winst zit niet meer in het model. Die zit in of je het betrouwbaar aan het werk krijgt.

Wat er deze week schoof

wat er nu kan

Gratis open modellen kruipen naar de top

De grootste sprong kwam deze week van open modellen die je gratis zelf mag draaien, en niet van de grote gesloten labs. Twee nieuwe Chinese modellen, MiniMax M3 en StepFun, kropen tot vlak onder het beste niveau voor programmeren. En Opus 4.8 van Anthropic zette de bovenkant neer.

Steeds meer top-AI is open en draaibaar op eigen of goedkope infra, niet alleen bij de grote labs.

verder lezen: JetBrains Mellum2-launch · ~4 min · open coding-MoE

voor wie het nakijkt

open-weights, coding, frontier · heat: SWE-Bench Pro 59% (MiniMax M3, open)

bewijs: MiniMax M3 59% SWE-Bench Pro · StepFun 198B/400tok/s · Opus 4.8 beste coding-model
bronnen: Introducing Claude Opus 4.8 · primary · MiniMax M3 open-weights 59% SWE-Bench Pro · x · StepFun Step 3.7 Flash 198B · x · NVIDIA Cosmos 3 open omni-model · hf

wat het kost

DeepSeek en open modellen zijn het populairst

De modellen die je gratis zelf kunt draaien stonden deze week bovenaan de lijstjes van wat ontwikkelaars echt gebruiken. De Chinese modellen van DeepSeek en Qwen kregen duizenden stemmen, en een veelgelezen stuk rekent voor dat zelf draaien goedkoper wordt dan betalen voor de dure topmodellen.

Krachtige AI per taak wordt spotgoedkoop, je betaalt straks vooral voor de inrichting en niet voor de tokens.

verder lezen: Signalbloom: outsourcing + local vs frontier labs · ~6 min · de kosten-redenering

voor wie het nakijkt

deepseek, open-weights, pricing, local · heat: HF 4548 upvotes (DeepSeek-V4-Pro)

bewijs: DeepSeek-V4-Pro 4548 HF-upvotes · -Flash 1349 · Qwen3.6-27B 1571
bronnen: DeepSeek-V4-Pro op HF · hf · Outsourcing plus local AI more economical, HN 323pt · hn · ollama v0.30 · primary

werkt het echt

AI voelt sneller dan het is

Het verschil tussen hoe snel AI voelt en hoe snel het echt is, kreeg deze week harde cijfers. In een onderzoek van METR voelden ervaren programmeurs zich 20% sneller met AI, maar waren ze 19% langzamer. Het werk verschoof: minder zelf schrijven, meer controleren wat de AI maakte.

Een AI-demo die snel voelt is nog geen snel product, de controle-last verschuift maar verdwijnt niet.

verder lezen: Ken Corey, "20% Faster / 19% Slower" · ~6 min · de RCT uitgelegd · datapro, "The AI Paradox" · ~8 min · de cijfers

voor wie het nakijkt

coding, productiviteit, METR, review · heat: 39-punts perceptiegat (METR) · HN 406pt

bewijs: METR RCT +20% gevoeld / -19% gemeten · reviewen 11,4u vs schrijven 9,8u/week
bronnen: Your Devs Think AI Made Them 20% Faster (Ken Corey) · grounding · Faster Code, More Failures (datapro) · web · Coders refusing to work without AI, TechCrunch · web · Frontend's lost decade, HN 406pt · hn · 20VC "The Ugly Truth About AI Coding" · spoken

wie aan de knoppen zit

Europa zet geld en regels achter eigen AI

Europa's wens om niet afhankelijk te zijn van Amerikaanse AI werd op twee fronten concreet. SoftBank kondigde 75 miljard euro aan voor datacenters en rekenkracht in Europa, en de Europese AI-wet maakt duidelijk dat AI die zelfstandig taken uitvoert vanaf augustus aan regels moet voldoen. Banken als BNP Paribas en Abanca draaien hun AI nu al binnen Europa.

Europese AI op eigen of EU-bodem wordt een echte optie, en agent-systemen krijgen vanaf augustus echte regels.

verder lezen: EU AI Act Newsletter #103 · ~5 min · wat augustus verplicht · Mistral-summit notes · ~6 min · EU on-prem in de praktijk (BNP, Abanca)

voor wie het nakijkt

eu, soevereiniteit, ai-act, compute · heat: €75 mld (SoftBank) · HN 465pt

bewijs: SoftBank €75 mld Europese compute · AI Act-transparantie vanaf aug 2026 · Mistral on-prem in productie
bronnen: SoftBank €75 mld Franse datacenters (NRC) · nrc · EU AI Act Newsletter #103: August Countdown · exa · EU wil geen digitale kolonie (NRC) · nrc · Notes Mistral AI Now Summit, HN 465pt · hn

hoe het voelt

AI-moeheid wordt gedrag, AI-vrij wordt een verkoopargument

De weerstand tegen AI werd deze week echt gedrag, geen gevoel meer. "Tired of Talking to AI" werd het drukste stuk op Hacker News, DuckDuckGo kreeg 28% meer bezoek en maakte z'n AI-vrije zoeken makkelijker vindbaar, en stukken over "stop met AI" raakten een snaar. Zelfs de grootste AI-doemdenkers draaiden bij.

Je klant en je personeel worden AI-moe, "door mensen gemaakt" wint aan waarde.

verder lezen: Please Use AI (Shawn Smucker) · ~7 min · de menselijke kant

voor wie het nakijkt

backlash, vertrouwen, human-led · heat: HN 2008pt · DuckDuckGo +28%

bewijs: HN-top 2008pt · DuckDuckGo +28% verkeer · doom-profeten draaien bij
bronnen: I'm Tired of Talking to AI, HN 2008pt · hn · DuckDuckGo +28% na Google's AI-mode (TechCrunch) · web · The solution might be cancelling my AI subscription, HN 380pt · hn · Altman + Amodei walk-back (Fortune) · web

Deze week doen

Lees de EU AI Act agent-FAQ en check of jouw AI-inzet onder de augustus-agentverplichtingen valt, vóór je je volgende architectuur kiest.

waarom nu: de August-countdown werd deze week concreet (Newsletter #103 + SoftBank €75 mld).
5 min: open Newsletter #103, bepaal welke agent-categorie je raakt.
1 uur: map je AI-pipeline tegen de agent-verplichtingen, noteer één architectuur-risico (EU-hosting?).

Gereedschapskist

DeepSeek-V4-Flash (open weights) · hf · goedkoop open model dat je op EU-bodem kunt draaien, privacy-vriendelijk alternatief voor gevoelige data.
JetBrains Mellum2-12B-A2.5B-Thinking · hf · open coding-model, goedkoop alternatief naast de grote labs voor wie tussen modellen wil wisselen.
ollama v0.30.0 · release · maakt lokaal modellen draaien makkelijker, handig voor on-prem of privacy-gevoelige experimenten.

Wat ik volg

als GPT-5.6 uitkomt (markt verwacht vóór eind juli) → de model-voorsprong verschuift, moment om je modelkeuze te herzien.
als de EU AI Act agent-regels actief worden (augustus) → agents krijgen verplichtingen, relevant zodra je AI iets laat beslissen of verwerken.
als DeepSeek of Qwen EU-gehost beschikbaar komt → krachtige AI op EU-bodem wordt realistisch voor wie met persoonsdata werkt.

Wat mij ongelijk zou geven

Als "AI-vrij" een tijdelijk moeheidssignaal blijkt in plaats van echt koopgedrag. Deze week géén tegenbewijs: het gedrag hield aan (DuckDuckGo +28% bleef, AI-vrije modus uitgerold).

Essay-kandidaten

praktijk · de coding-productiviteit-paradox: sterke counter (gevoel +20% vs meting -19%) + traject + raakt elke MKB'er die "AI maakt ons sneller" gelooft. Nieuwe angle: niet "de tools volwassen", maar "de winst zit in de rol-verschuiving, niet het tempo".
macht · Europa bouwt een eigen AI-stack: SoftBank €75 mld + Mistral on-prem + AI Act August-countdown geven een concrete EU-soevereiniteit-angle.

Bewust NIET als verse essay: de stemming · AI-moeheid is al gedekt door de Notitie ai-moeheid-mens-vooraan + de W23 deep-dive. Sterk signaal, maar geen nieuw essay.

Wat ik je bespaar

Healthcare AI-governance (Utah clinical sandbox, MS Copilot Health, Tempus): hoge diepte in de dump, maar niche zonder brede MKB-haak deze week. Bewust overgeslagen.
GPT-5.6 Polymarket-timing (88% vóór eind juli): signaleert dat Opus' voorsprong tijdelijk is, maar er valt niks te acteren tot het uit is. Staat op de watchlist hierboven.
De arXiv-stroom (50 papers, multimodal/continual-learning): academisch, geen MKB-haak deze week.
United 767 Bluetooth-bom + SF-robots-in-Airbnbs: hoog op HN, puur ruis.

Mijn voorspellingen

Wat ik denk dat er gaat gebeuren in AI, en hoe het uitpakt. Ook als ik ongelijk had.

2 bevestigd18 open0 weerlegd

Op korte termijn13

opensinds 2026-W26 · review na 2026-W34
Voor eind 2026-W34 wisselt minstens een van de drie grote Amerikaanse labs (OpenAI, Anthropic, Google) opnieuw een frontier-model van publieke beschikbaarheid naar overheids- of toegangsbeperking
opensinds 2026-W25 · review na 2026-W40
Voor eind 2026-W40 verwijst minstens een tweede EU-rechterlijke uitspraak, toezichthouder of officiele richtlijn naar het Duitse AI-Overviews-oordeel als grond voor directe aanbieder-aansprakelijkheid voor AI-output
het bewijs
W26: geen nieuwe juridische verwijzing; de EU stemde wel in met uitstel van enkele AI Act-verplichtingen, wat de richting eerder vertraagt dan versnelt
opensinds 2026-W24 · review na 2026-W40
Werkgeheugen blijft duur (32GB DDR5 boven ~250 euro) tot eind 2026 door AI-datacentervraag, wat lokaal AI draaien minder goedkoop maakt dan de gratis open-weights suggereren
opensinds 2026-W23 · review na 2026-W36
EU-gehoste of on-prem AI wordt voor eind W36 een expliciete inkoop- of architectuurfactor in minstens een gevoelige-data-sector (juridisch/zorg/finance) in NL/EU, gedreven door AI Act-agentregels (augustus) plus Europese compute
het bewijs
W26: de overheids-gating van GPT-5.6 en Mythos 5 maakte US-afhankelijkheid opnieuw tastbaar; zelf-draaibaar of binnen de EU verschoof van ideologie naar continuiteitsargument
opensinds 2026-W23 · review na 2026-W36
Voor eind 2026-W36 staat een open-weights model (DeepSeek, Qwen of StepFun) in de top-3 van SWE-Bench Pro, op closed-flagship-niveau
het bewijs
bewijs stapelt W24: MiniMax M3 op 54.7 van de Artificial Analysis Intelligence-index (open, vlak onder flagship); W26: GLM-5.2 komt binnen als sterkste open model voor coding/agents, het bewijs blijft richting de W36-deadline stapelen
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 voert minstens een mainstream NL/EU-merk 'door mensen gemaakt' of 'AI-vrij' actief als verkoopargument (label, campagne of premium-tier)
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 wordt 'AI-investeringen leveren nog niet op' een dominant mainstream-narratief op cover-story-niveau, wat MKB voorzichtiger maakt
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 bevestigt Apple publiekelijk dat de Gemini-Siri-inferentie via Apple's Private Cloud Compute loopt (niet rauw naar Google), als GDPR-relevant verkoopargument
het bewijs
beweegt sterk W24: Apple toont op WWDC een drie-lagen-Siri (toestel / Apple privacy-cloud / Google-cloud voor complexe taken), gerapporteerd 1,2T-Gemini ~1mld/jr, geen EU-launch; expliciete GDPR-framing ontbreekt nog
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 draait een open MoE-model van Qwen of DeepSeek-V4-Flash-klasse (near-frontier reasoning) bruikbaar boven 20 tokens/sec lokaal op een Mac van maximaal 4000 euro
opensinds 2026-W22 · review na 2026-W34
Kosten-per-taak wordt binnen 2 kwartalen de dominante AI-inkooplens bij MKB
opensinds 2026-W21 · review na 2026-W30
Coding-tools-laag commoditiseert binnen ~12 maanden
bevestigdsinds 2026-W19 · review na 2026-W22
AI inside zakt als verkoopargument, human-led stijgt
het bewijs
HN-top "I'm Tired of Talking to AI" (W22 1724pt naar W23 2008pt) + DuckDuckGo +28% + AI-vrij als feature; herbevestigd W23; herbevestigd W24: "AI is slowing down" 613pt + zelfbewuste anti-AI-vraag 455pt; herbevestigd W26: Ford haalt ervaren mensen terug bij z'n agent-uitrol, bouwers willen de code-review aanscherpen, en de "AI verbrandt de toast, ik schraap 'm af"-stemming
bevestigdsinds 2026-W18 · review na 2026-W22
China haalt de bodem onder flagship-pricing weg
het bewijs
DeepSeek 75% korting permanent + Qwen Opus-niveau (W22); herbevestigd W23: DeepSeek-V4-Pro/Flash + Qwen3.6 voeren HF-trending aan (open-weights naderen flagship); herbevestigd W24: 25+ open modellen in 1 week, DeepSeek-V4-Pro #1 HF (4730), Google geeft Gemma 4 zelf open vrij; herbevestigd W26: Zhipu's open GLM-5.2 voert de open-model-ranglijst aan, juist nu de Amerikaanse topmodellen achter een overheidshek verdwijnen

~1 jaar6

opensinds 2026-W23 · review na 2027-W23
Voor 2027-W23 wordt minstens een top coding-tool (Cursor, Copilot, Windsurf of Claude Code) overgenomen of fundamenteel van 'tool' naar 'platform/agent' herpositioneerd
opensinds 2026-W23 · review na 2027-W23
Voor 2027-W23 brengt een grote partij (OpenAI, Anthropic, Google, Apple of Microsoft) een mainstream proactieve persoonlijke assistent die een fleet van agents aanstuurt
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 haalt de METR 50%-task-horizon taken die mensen minstens een volledige werkdag (8 uur) kosten, voor generalist-agents
opensinds 2026-W23 · review na 2028-W22
Voor 2028-W22 is er geen algemeen beschikbaar agent-product dat een NL-MKB-werknemerrol end-to-end vervangt met persistent leren over sessies, op productie-betrouwbaarheid (Karpathy continual-learning-test, human-moat-tracker)
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 ziet minstens een traditioneel NL-kwaliteitsmerk (Volkskrant, NRC of FD) een meetbare opleving in betalende abonnees of print-oplage, mede gedreven door deepfake-/fake-news-moeheid en 'geverifieerd door mensen' als waarde (flight to verified-human)
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 wordt parasociale AI-schade ('AI-psychose', ongezonde AI-afhankelijkheid) een erkende categorie in minstens een Westers land: een formele gezondheidsrichtlijn, klinische erkenning, of door een toezichthouder afgedwongen platform-maatregel

~3 jaar (horizon-watch)1

opensinds 2026-W23 · review na 2028-W52
Voor eind 2028 publiceert minstens een frontier-lab een geverifieerde, reproduceerbare autonome verbetering door een AI aan z'n eigen training of architectuur boven menselijke baseline (Clark 60%-scenario)