De AI Brief · week 23
De AI-euforie koelt af.
Verder deze week: open modellen worden bijna gratis, en 'sneller door AI' blijkt vaak meer gevoel dan winst.
Waar staan we
Deze week werd het gesprek over AI een stuk nuchterder. Mensen raken AI-moe. "Tired of Talking to AI" was het best gelezen stuk op Hacker News. DuckDuckGo kreeg 28% meer bezoek met een zoekmodus zonder AI. Zelfs de bazen van OpenAI en Anthropic trokken hun "AI pakt je baan"-voorspelling terug.
Bij bedrijven verschuift de vraag van "wat kan AI" naar "wat levert het op". Opus 4.8 werd het beste model om mee te programmeren. Tegelijk liet een groot onderzoek zien: ervaren programmeurs voelden zich 20% sneller met AI, maar waren 19% langzamer.
De rode draad: de techniek wordt spotgoedkoop, en steeds vaker draai je 'm gratis op je eigen machine. De winst zit niet meer in het model. Die zit in of je het betrouwbaar aan het werk krijgt.
Wat er deze week schoof
wat er nu kan
Gratis open modellen kruipen naar de top
De grootste sprong kwam deze week van open modellen die je gratis zelf mag draaien, en niet van de grote gesloten labs. Twee nieuwe Chinese modellen, MiniMax M3 en StepFun, kropen tot vlak onder het beste niveau voor programmeren. En Opus 4.8 van Anthropic zette de bovenkant neer.
Steeds meer top-AI is open en draaibaar op eigen of goedkope infra, niet alleen bij de grote labs.
- verder lezen: JetBrains Mellum2-launch · ~4 min · open coding-MoE
voor wie het nakijkt
open-weights, coding, frontier · heat: SWE-Bench Pro 59% (MiniMax M3, open)
- bewijs: MiniMax M3 59% SWE-Bench Pro · StepFun 198B/400tok/s · Opus 4.8 beste coding-model
- bronnen: Introducing Claude Opus 4.8 ·
primary· MiniMax M3 open-weights 59% SWE-Bench Pro ·x· StepFun Step 3.7 Flash 198B ·x· NVIDIA Cosmos 3 open omni-model ·hf
wat het kost
DeepSeek en open modellen zijn het populairst
De modellen die je gratis zelf kunt draaien stonden deze week bovenaan de lijstjes van wat ontwikkelaars echt gebruiken. De Chinese modellen van DeepSeek en Qwen kregen duizenden stemmen, en een veelgelezen stuk rekent voor dat zelf draaien goedkoper wordt dan betalen voor de dure topmodellen.
Krachtige AI per taak wordt spotgoedkoop, je betaalt straks vooral voor de inrichting en niet voor de tokens.
- verder lezen: Signalbloom: outsourcing + local vs frontier labs · ~6 min · de kosten-redenering
voor wie het nakijkt
deepseek, open-weights, pricing, local · heat: HF 4548 upvotes (DeepSeek-V4-Pro)
- bewijs: DeepSeek-V4-Pro 4548 HF-upvotes · -Flash 1349 · Qwen3.6-27B 1571
- bronnen: DeepSeek-V4-Pro op HF ·
hf· Outsourcing plus local AI more economical, HN 323pt ·hn· ollama v0.30 ·primary
werkt het echt
AI voelt sneller dan het is
Het verschil tussen hoe snel AI voelt en hoe snel het echt is, kreeg deze week harde cijfers. In een onderzoek van METR voelden ervaren programmeurs zich 20% sneller met AI, maar waren ze 19% langzamer. Het werk verschoof: minder zelf schrijven, meer controleren wat de AI maakte.
Een AI-demo die snel voelt is nog geen snel product, de controle-last verschuift maar verdwijnt niet.
- verder lezen: Ken Corey, "20% Faster / 19% Slower" · ~6 min · de RCT uitgelegd · datapro, "The AI Paradox" · ~8 min · de cijfers
voor wie het nakijkt
coding, productiviteit, METR, review · heat: 39-punts perceptiegat (METR) · HN 406pt
- bewijs: METR RCT +20% gevoeld / -19% gemeten · reviewen 11,4u vs schrijven 9,8u/week
- bronnen: Your Devs Think AI Made Them 20% Faster (Ken Corey) ·
grounding· Faster Code, More Failures (datapro) ·web· Coders refusing to work without AI, TechCrunch ·web· Frontend's lost decade, HN 406pt ·hn· 20VC "The Ugly Truth About AI Coding" ·spoken
wie aan de knoppen zit
Europa zet geld en regels achter eigen AI
Europa's wens om niet afhankelijk te zijn van Amerikaanse AI werd op twee fronten concreet. SoftBank kondigde 75 miljard euro aan voor datacenters en rekenkracht in Europa, en de Europese AI-wet maakt duidelijk dat AI die zelfstandig taken uitvoert vanaf augustus aan regels moet voldoen. Banken als BNP Paribas en Abanca draaien hun AI nu al binnen Europa.
Europese AI op eigen of EU-bodem wordt een echte optie, en agent-systemen krijgen vanaf augustus echte regels.
- verder lezen: EU AI Act Newsletter #103 · ~5 min · wat augustus verplicht · Mistral-summit notes · ~6 min · EU on-prem in de praktijk (BNP, Abanca)
voor wie het nakijkt
eu, soevereiniteit, ai-act, compute · heat: €75 mld (SoftBank) · HN 465pt
- bewijs: SoftBank €75 mld Europese compute · AI Act-transparantie vanaf aug 2026 · Mistral on-prem in productie
- bronnen: SoftBank €75 mld Franse datacenters (NRC) ·
nrc· EU AI Act Newsletter #103: August Countdown ·exa· EU wil geen digitale kolonie (NRC) ·nrc· Notes Mistral AI Now Summit, HN 465pt ·hn
hoe het voelt
AI-moeheid wordt gedrag, AI-vrij wordt een verkoopargument
De weerstand tegen AI werd deze week echt gedrag, geen gevoel meer. "Tired of Talking to AI" werd het drukste stuk op Hacker News, DuckDuckGo kreeg 28% meer bezoek en maakte z'n AI-vrije zoeken makkelijker vindbaar, en stukken over "stop met AI" raakten een snaar. Zelfs de grootste AI-doemdenkers draaiden bij.
Je klant en je personeel worden AI-moe, "door mensen gemaakt" wint aan waarde.
- verder lezen: Please Use AI (Shawn Smucker) · ~7 min · de menselijke kant
voor wie het nakijkt
backlash, vertrouwen, human-led · heat: HN 2008pt · DuckDuckGo +28%
- bewijs: HN-top 2008pt · DuckDuckGo +28% verkeer · doom-profeten draaien bij
- bronnen: I'm Tired of Talking to AI, HN 2008pt ·
hn· DuckDuckGo +28% na Google's AI-mode (TechCrunch) ·web· The solution might be cancelling my AI subscription, HN 380pt ·hn· Altman + Amodei walk-back (Fortune) ·web
Deze week doen
Lees de EU AI Act agent-FAQ en check of jouw AI-inzet onder de augustus-agentverplichtingen valt, vóór je je volgende architectuur kiest.
- waarom nu: de August-countdown werd deze week concreet (Newsletter #103 + SoftBank €75 mld).
- 5 min: open Newsletter #103, bepaal welke agent-categorie je raakt.
- 1 uur: map je AI-pipeline tegen de agent-verplichtingen, noteer één architectuur-risico (EU-hosting?).
Gereedschapskist
- DeepSeek-V4-Flash (open weights) · hf · goedkoop open model dat je op EU-bodem kunt draaien, privacy-vriendelijk alternatief voor gevoelige data.
- JetBrains Mellum2-12B-A2.5B-Thinking · hf · open coding-model, goedkoop alternatief naast de grote labs voor wie tussen modellen wil wisselen.
- ollama v0.30.0 · release · maakt lokaal modellen draaien makkelijker, handig voor on-prem of privacy-gevoelige experimenten.
Wat ik volg
- als GPT-5.6 uitkomt (markt verwacht vóór eind juli) → de model-voorsprong verschuift, moment om je modelkeuze te herzien.
- als de EU AI Act agent-regels actief worden (augustus) → agents krijgen verplichtingen, relevant zodra je AI iets laat beslissen of verwerken.
- als DeepSeek of Qwen EU-gehost beschikbaar komt → krachtige AI op EU-bodem wordt realistisch voor wie met persoonsdata werkt.
Wat mij ongelijk zou geven
Als "AI-vrij" een tijdelijk moeheidssignaal blijkt in plaats van echt koopgedrag. Deze week géén tegenbewijs: het gedrag hield aan (DuckDuckGo +28% bleef, AI-vrije modus uitgerold).
Essay-kandidaten
- praktijk · de coding-productiviteit-paradox: sterke counter (gevoel +20% vs meting -19%) + traject + raakt elke MKB'er die "AI maakt ons sneller" gelooft. Nieuwe angle: niet "de tools volwassen", maar "de winst zit in de rol-verschuiving, niet het tempo".
- macht · Europa bouwt een eigen AI-stack: SoftBank €75 mld + Mistral on-prem + AI Act August-countdown geven een concrete EU-soevereiniteit-angle.
Bewust NIET als verse essay: de stemming · AI-moeheid is al gedekt door de Notitie ai-moeheid-mens-vooraan + de W23 deep-dive. Sterk signaal, maar geen nieuw essay.
Wat ik je bespaar
- Healthcare AI-governance (Utah clinical sandbox, MS Copilot Health, Tempus): hoge diepte in de dump, maar niche zonder brede MKB-haak deze week. Bewust overgeslagen.
- GPT-5.6 Polymarket-timing (88% vóór eind juli): signaleert dat Opus' voorsprong tijdelijk is, maar er valt niks te acteren tot het uit is. Staat op de watchlist hierboven.
- De arXiv-stroom (50 papers, multimodal/continual-learning): academisch, geen MKB-haak deze week.
- United 767 Bluetooth-bom + SF-robots-in-Airbnbs: hoog op HN, puur ruis.
Mijn voorspellingen
Wat ik denk dat er gaat gebeuren in AI, en hoe het uitpakt. Ook als ik ongelijk had.
Op korte termijn6
- open
EU-gehoste of on-prem AI wordt voor eind W36 een expliciete inkoop- of architectuurfactor in minstens een gevoelige-data-sector (juridisch/zorg/finance) in NL/EU, gedreven door AI Act-agentregels (augustus) plus Europese compute
- open
Voor eind 2026-W36 staat een open-weights model (DeepSeek, Qwen of StepFun) in de top-3 van SWE-Bench Pro, op closed-flagship-niveau
- open
Kosten-per-taak wordt binnen 2 kwartalen de dominante AI-inkooplens bij MKB
- open
Coding-tools-laag commoditiseert binnen ~12 maanden
- bevestigd
AI inside zakt als verkoopargument, human-led stijgt
het bewijs
HN-top "I'm Tired of Talking to AI" (W22 1724pt naar W23 2008pt) + DuckDuckGo +28% + AI-vrij als feature; herbevestigd W23
- bevestigd
China haalt de bodem onder flagship-pricing weg
het bewijs
DeepSeek 75% korting permanent + Qwen Opus-niveau (W22); herbevestigd W23: DeepSeek-V4-Pro/Flash + Qwen3.6 voeren HF-trending aan (open-weights naderen flagship)
~1 jaar10
- open
Voor eind 2026 voert minstens een mainstream NL/EU-merk 'door mensen gemaakt' of 'AI-vrij' actief als verkoopargument (label, campagne of premium-tier)
- open
Voor eind 2026 wordt 'AI-investeringen leveren nog niet op' een dominant mainstream-narratief op cover-story-niveau, wat MKB voorzichtiger maakt
- open
Voor 2027-W23 wordt minstens een top coding-tool (Cursor, Copilot, Windsurf of Claude Code) overgenomen of fundamenteel van 'tool' naar 'platform/agent' herpositioneerd
- open
Voor 2027-W23 brengt een grote partij (OpenAI, Anthropic, Google, Apple of Microsoft) een mainstream proactieve persoonlijke assistent die een fleet van agents aanstuurt
- open
Voor eind 2026 bevestigt Apple publiekelijk dat de Gemini-Siri-inferentie via Apple's Private Cloud Compute loopt (niet rauw naar Google), als GDPR-relevant verkoopargument
- open
Voor eind 2026 draait een open MoE-model van Qwen of DeepSeek-V4-Flash-klasse (near-frontier reasoning) bruikbaar boven 20 tokens/sec lokaal op een Mac van maximaal 4000 euro
- open
Voor eind 2027 haalt de METR 50%-task-horizon taken die mensen minstens een volledige werkdag (8 uur) kosten, voor generalist-agents
- open
Voor 2028-W22 is er geen algemeen beschikbaar agent-product dat een NL-MKB-werknemerrol end-to-end vervangt met persistent leren over sessies, op productie-betrouwbaarheid (Karpathy continual-learning-test, human-moat-tracker)
- open
Voor eind 2027 ziet minstens een traditioneel NL-kwaliteitsmerk (Volkskrant, NRC of FD) een meetbare opleving in betalende abonnees of print-oplage, mede gedreven door deepfake-/fake-news-moeheid en 'geverifieerd door mensen' als waarde (flight to verified-human)
- open
Voor eind 2027 wordt parasociale AI-schade ('AI-psychose', ongezonde AI-afhankelijkheid) een erkende categorie in minstens een Westers land: een formele gezondheidsrichtlijn, klinische erkenning, of door een toezichthouder afgedwongen platform-maatregel
~3 jaar (horizon-watch)1
- open
Voor eind 2028 publiceert minstens een frontier-lab een geverifieerde, reproduceerbare autonome verbetering door een AI aan z'n eigen training of architectuur boven menselijke baseline (Clark 60%-scenario)