De AI Brief · week 24

Apple stopt Google's AI in de iPhone

Verder deze week: meer dan 25 open modellen in zeven dagen (nu ook Google's eigen), de AI-moeheid wordt zelfbewust, en je werkgeheugen wordt duurder door de AI-honger naar chips.

9 jun 2026 · de hele week · door een mens, AI als gereedschap

Waar staan we

Twee dingen liepen deze week uit elkaar. Het gevoel koelde verder af: "AI gaat langzamer" was een van de best gelezen stukken op Hacker News, en de techgemeenschap vroeg zich daar hardop af waarom ze zelf zo afwijzend is geworden. Tegelijk versnelde wat er gebouwd wordt. In één week kwamen er meer dan 25 open modellen uit, en Apple bleek z'n nieuwe Siri op de modellen van Google te bouwen in plaats van iets eigens.

Onder die twee verhalen schuift de rekening op naar onverwachte plekken. Uber zette een limiet van 1500 dollar per maand op AI-gebruik, en de prijs van werkgeheugen stijgt omdat de AI-datacenters de chips opkopen. De modellen worden gratis, maar het kost ergens anders.

En het gat tussen "het werkt" en "het is veilig" werd zichtbaar: duizenden Instagram-accounts werden gekaapt via Meta's AI-chatbot, en in Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden.

Wat er deze week schoof

wie aan de knoppen zit

Apple bouwt z'n nieuwe Siri op Google's Gemini

Op WWDC kondigde Apple "Siri AI" aan, gebouwd op Google's Gemini in plaats van een eigen model. Het draait in drie lagen: op het toestel zelf, via Apple's eigen privacy-cloud, en alleen de meest complexe taken gaan naar Google's cloud. Apple lanceert 'm voorlopig niet in de EU. Volgens berichten gaat het om een Gemini-model van 1,2 biljoen parameters en een deal van rond een miljard dollar per jaar. Het bedrijf dat privacy als merk voert, huurt z'n AI-brein in bij z'n grootste concurrent, en houdt het juist in Europa tegen.

Zelfs Apple bouwt niet alles zelf, en de vraag waar je AI fysiek draait, op het toestel, in een EU-cloud of bij een Amerikaanse reus, wordt een echte keuze.

verder lezen: WIRED: Apple's New Siri AI Is Ready to Get Personal · ~6 min · wat de drie-lagen-architectuur betekent

voor wie het nakijkt

apple, google, gemini, wwdc, platform · heat: HN 660pt · WWDC 2026

bewijs: officieel op WWDC 2026, Siri AI op Gemini · drie-lagen-routing (toestel / Apple privacy-cloud / Google-cloud voor complexe taken) · geen EU-launch bij release · gerapporteerd: 1,2T-model, ~1 mld dollar per jaar
bronnen: Apple reveals new AI architecture built around Google Gemini · hn · Apple's New Siri AI Is Ready to Get Personal (WIRED) · web · Gemini-partnership nu officieel (MacObserver) · web · Apple introduces Siri AI · primary

wat er nu kan

Meer dan 25 open modellen in één week, nu ook Google's eigen

De open-modellengolf van vorige weken werd een stortvloed: in zeven dagen kwamen er meer dan 25 open modellen uit, aangevoerd door NVIDIA's Nemotron 3 Ultra en, opvallend, Google's eigen Gemma 4. DeepSeek-V4-Pro stond met afstand bovenaan de werkelijke interesse, en MiniMax M3 kwam als open model tot vlak onder het beste niveau. Een gesloten lab als Google geeft nu zelf een sterk model gratis weg.

Krachtige AI om zelf te draaien wordt elke week breder beschikbaar, ook van de grote merken, niet alleen van de uitdagers.

verder lezen: JetBrains Mellum2-12B-Thinking · ~4 min · open coding-model · LiquidAI LFM2.5-8B-A1B · ~3 min · klein en efficiënt

voor wie het nakijkt

open-weights, gemma, deepseek, frontier · heat: HF 4730 upvotes (DeepSeek-V4-Pro)

bewijs: 25+ open modellen in 1 week · DeepSeek-V4-Pro 4730 HF-upvotes · Gemma 4 (Google, open) 784 · MiniMax M3 54.7 op de Artificial Analysis-index
bronnen: 25+ open-weight models in één week, NVIDIA Nemotron 3 Ultra + Google Gemma 4 · x · DeepSeek-V4-Pro op HF · hf · google/gemma-4-12B-it · hf · MiniMax M3 54.7 op de Intelligence-index · x

hoe het voelt

De AI-moeheid wordt een bubbel-vraag

De terugslag kreeg vorige weken taal, deze week werd 'ie financieel. "AI gaat langzamer" werd een van de best gelezen stukken op Hacker News, de techgemeenschap vroeg zich hardop af waarom ze zelf zo afwijzend is geworden, en op social ging het over een "vibe shift": tokenmaxxing is uit, Silicon Valley twijfelt. Op de voorspellingsmarkt staat de kans dat de AI-bubbel dit jaar barst op 22%, en een veelgedeelde post stelt dat "het gratis feest voorbij is nu de echte kosten zichtbaar worden". Het verhaal kantelt van moeheid naar openlijke twijfel of het rendeert.

De stemming kantelt van AI-moeheid naar de vraag of het wel oplevert, en "door mensen gemaakt" plus een aantoonbaar rendement winnen aan waarde.

verder lezen: AI is slowing down (Ed Zitron) · ~12 min · het bubbel-argument, scherp en omstreden

voor wie het nakijkt

backlash, bubbel, hype-cycle, human-led · heat: HN 613pt · Polymarket 22%

bewijs: "AI is slowing down" HN 613pt · Polymarket 22% kans bubbel barst voor jaareind · "vibe shift is real, tokenmaxxing dies out" (Mashable) · @Telegraph "the free lunch is over" 3.571 likes
bronnen: AI is slowing down (Ed Zitron) · hn · Why is the HN crowd so anti-AI? · hn · The AI vibe shift is real (Mashable) · web · The AI hype cycle will slow down (TNW) · web

werkt het echt

AI wint in het examenlokaal en de rechtszaal, maar de vaardigheid erodeert

Twee kanten van dezelfde medaille kwamen samen. In Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden (ruim een derde zakte voor het inleidende vak), terwijl een Stanford-studie liet zien dat AI-antwoorden op juridische vragen in driekwart van de gevallen wonnen van die van professoren. AI presteert beter op de output, maar de onderliggende vaardigheid bij mensen brokkelt af. In Nederland gaf ING als eerste bank AI een grote rol bij het beoordelen van hypotheken.

AI levert sneller goede output, maar wie de onderliggende kennis kwijtraakt kan de fouten niet meer zien, en die controle is precies wat je inkoopt.

verder lezen: Mathematicians issue warning as AI gains ground · ~6 min · dezelfde spanning in de wiskunde

voor wie het nakijkt

onderwijs, juridisch, skill-erosie · heat: HN 830pt (Berkeley) + 416pt (Stanford)

bewijs: Berkeley 35,3% F's in inleidend CS-vak · Stanford AI wint 75% van juridische vergelijkingen (~3000 blinde beoordelingen) · ING zet AI in bij hypotheekbeoordeling
bronnen: Failing grades soar with AI usage at Berkeley CS · hn · AI outperforms law professors, Stanford · hn · ING geeft AI grote rol bij hypotheekbeoordeling · nl · Wolters Kluwer en OpenAI, analisten sceptisch · nl

wat het kost

De gratis modellen, de duurdere rekening

De modellen worden gratis, maar de rekening duikt elders op. Uber zette een limiet van 1500 dollar per maand op AI-gebruik per medewerker, een signaal dat bedrijven het verbruik gaan rantsoeneren. En de prijs van werkgeheugen schiet omhoog omdat de AI-datacenters de chips opkopen: 32GB werkgeheugen kost nu fors meer dan een jaar geleden. Zelf een model lokaal draaien is gratis qua software, maar de machine eronder wordt duurder.

De AI zelf wordt goedkoper, maar reken op een limiet of een hogere hardware-rekening, en stuur op kosten-per-taak in plaats van onbeperkt gebruik.

verder lezen: Uber caps usage, Willison's analyse · ~4 min · waarom dit een prijssignaal is

voor wie het nakijkt

kosten, hardware, geheugen · heat: HN 623pt (Uber) + 434pt (DDR5)

bewijs: Uber-limiet 1500 dollar/maand/medewerker · 32GB DDR5 nu rond 375 dollar minimum (was ~100 dollar een jaar terug) · "Corporate America rantsoeneert AI"
bronnen: Uber's $1,500/month AI limit (Simon Willison) · hn · 32GB DDR5 nu 375 dollar, AI-tekort knijpt PC-bouw · hn

Deze week doen

Check of je AI-architectuur weet wáár elk model draait en onder welke wetgeving, nu zelfs Apple z'n AI in Europa terughoudt.

waarom nu: Apple lanceert z'n Gemini-Siri voorlopig niet in de EU, en de AI Act-agentregels komen in augustus. "Waar draait dit" wordt een inkoopvraag.
5 min: noteer per AI-onderdeel in je stack welk model het is en in welke regio het draait.
1 uur: markeer de onderdelen die persoonsdata raken en bepaal voor minstens één een EU-gehost of lokaal alternatief.

Gereedschapskist

google/gemma-4-12B-it (open weights) · hf · Google's eigen open model, sterk en gratis te draaien, goed om naast je gesloten model te testen.
JetBrains Mellum2-12B-Thinking · hf · open coding-model, goedkoop alternatief om in je routing te wisselen.
Anthropic defending-code-reference-harness · github · open raamwerk om met AI kwetsbaarheden in je eigen code te zoeken, relevant nu de hacks via AI toenemen.

Wat ik volg

als Apple Intelligence (Gemini) in de EU landt → dan zie je hoe de privacy-architectuur eruitziet, een blauwdruk voor "AI met gevoelige data onder EU-wetgeving".
als de geheugen- en chipprijzen hoog blijven → dan wordt lokaal AI draaien duurder dan de gratis modellen doen vermoeden, relevant voor wie on-prem overweegt.
als "AI gaat langzamer" een mainstream cover-verhaal wordt → dan worden MKB-klanten voorzichtiger, en "kleine bewezen stappen" verkoopt beter dan "kijk hoe slim".

Mijn voorspellingen

P-2026-W19-1 "AI inside zakt, human-led stijgt" · bevestigd (sinds W19) · herbevestigd W24: "AI is slowing down" 613pt + de zelfbewuste anti-AI-vraag 455pt.
P-2026-W18-1 "China haalt de bodem onder flagship-pricing" · bevestigd (sinds W18) · herbevestigd W24: 25+ open modellen in een week, DeepSeek-V4-Pro voert de interesse aan, Google sluit aan met open Gemma 4.
P-2026-W23-7 "Apple bevestigt Gemini-Siri via z'n privacy-cloud als GDPR-argument" · open (sinds W23, due W52) · beweegt sterk: Apple toonde op WWDC een drie-lagen-Siri met een eigen privacy-cloud-laag naast Google, alleen de expliciete GDPR-framing als verkoopargument ontbreekt nog.
P-2026-W23-2 "Open-weights model in top-3 SWE-Bench Pro voor W36" · open (sinds W23, due W36) · bewijs stapelt: MiniMax M3 op 54.7 van de Intelligence-index.
P-2026-W24-1 "Werkgeheugen blijft duur (32GB DDR5 boven ~250 euro) tot eind 2026 door AI-datacentervraag, wat lokaal AI draaien minder goedkoop maakt dan de gratis modellen suggereren" · open (nieuw, due W40).

Wat mij ongelijk zou geven

Als "AI gaat langzamer" puur sentiment blijkt en de capability-cijfers het tegenspreken. Deze week géén schoon tegenbewijs: de open-modellengolf (25 in een week) en AI dat rechtsprofessoren verslaat tonen juist dat het bouwen versnelt terwijl het gevoel afkoelt. Dat gat is het signaal, niet de afkoeling zelf.

Essay-kandidaten

macht · Apple huurt z'n AI-brein in bij Google: sterke counter (het privacy-merk kiest de concurrent én houdt het uit de EU) + raakt elke MKB'er die zich afvraagt waar z'n AI draait. Verse angle: "wie geen eigen model heeft, koopt afhankelijkheid, en waar dat draait wordt jouw verantwoordelijkheid".
praktijk · AI wint de output, de vaardigheid erodeert: Berkeley-cijfers + Stanford-juristen geven een concrete counter op "AI maakt ons gewoon beter". Angle: de waarde verschuift naar wie de fouten nog kan zien.

Bewust NIET als verse essay: de stemming · AI-moeheid is al gedekt door de Notitie + de W23 deep-dive. Sterk signaal deze week ("AI gaat langzamer"), maar geen nieuw verhaal, hooguit een update-regel.

Wat ik je bespaar

De arXiv-stroom (50 papers, world-models/continual-learning/agents): academisch, geen MKB-haak deze week.
De US-AI-politiek (Trump's afgezwakte AI-order, het voorstel om staatswetten 3 jaar te bevriezen): relevant voor het grote plaatje, maar niet actiebaar voor NL/EU-MKB deze week.
AI-securityincidenten in detail (Meta Instagram-kaping, Microsoft-tools gehackt): belangrijk signaal dat AI een aanvalsoppervlak wordt, maar de losse incidenten zijn nieuws, geen actie. De les zit in de Gereedschapskist (zoek kwetsbaarheden in je eigen code).
De ISS-luchtlek + Smart-TV-scraping: hoog op HN, geen AI-MKB-relevantie.

Mijn voorspellingen

Wat ik denk dat er gaat gebeuren in AI, en hoe het uitpakt. Ook als ik ongelijk had.

2 bevestigd18 open0 weerlegd

Op korte termijn13

opensinds 2026-W26 · review na 2026-W34
Voor eind 2026-W34 wisselt minstens een van de drie grote Amerikaanse labs (OpenAI, Anthropic, Google) opnieuw een frontier-model van publieke beschikbaarheid naar overheids- of toegangsbeperking
opensinds 2026-W25 · review na 2026-W40
Voor eind 2026-W40 verwijst minstens een tweede EU-rechterlijke uitspraak, toezichthouder of officiele richtlijn naar het Duitse AI-Overviews-oordeel als grond voor directe aanbieder-aansprakelijkheid voor AI-output
het bewijs
W26: geen nieuwe juridische verwijzing; de EU stemde wel in met uitstel van enkele AI Act-verplichtingen, wat de richting eerder vertraagt dan versnelt
opensinds 2026-W24 · review na 2026-W40
Werkgeheugen blijft duur (32GB DDR5 boven ~250 euro) tot eind 2026 door AI-datacentervraag, wat lokaal AI draaien minder goedkoop maakt dan de gratis open-weights suggereren
opensinds 2026-W23 · review na 2026-W36
EU-gehoste of on-prem AI wordt voor eind W36 een expliciete inkoop- of architectuurfactor in minstens een gevoelige-data-sector (juridisch/zorg/finance) in NL/EU, gedreven door AI Act-agentregels (augustus) plus Europese compute
het bewijs
W26: de overheids-gating van GPT-5.6 en Mythos 5 maakte US-afhankelijkheid opnieuw tastbaar; zelf-draaibaar of binnen de EU verschoof van ideologie naar continuiteitsargument
opensinds 2026-W23 · review na 2026-W36
Voor eind 2026-W36 staat een open-weights model (DeepSeek, Qwen of StepFun) in de top-3 van SWE-Bench Pro, op closed-flagship-niveau
het bewijs
bewijs stapelt W24: MiniMax M3 op 54.7 van de Artificial Analysis Intelligence-index (open, vlak onder flagship); W26: GLM-5.2 komt binnen als sterkste open model voor coding/agents, het bewijs blijft richting de W36-deadline stapelen
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 voert minstens een mainstream NL/EU-merk 'door mensen gemaakt' of 'AI-vrij' actief als verkoopargument (label, campagne of premium-tier)
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 wordt 'AI-investeringen leveren nog niet op' een dominant mainstream-narratief op cover-story-niveau, wat MKB voorzichtiger maakt
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 bevestigt Apple publiekelijk dat de Gemini-Siri-inferentie via Apple's Private Cloud Compute loopt (niet rauw naar Google), als GDPR-relevant verkoopargument
het bewijs
beweegt sterk W24: Apple toont op WWDC een drie-lagen-Siri (toestel / Apple privacy-cloud / Google-cloud voor complexe taken), gerapporteerd 1,2T-Gemini ~1mld/jr, geen EU-launch; expliciete GDPR-framing ontbreekt nog
opensinds 2026-W23 · review na 2026-W52
Voor eind 2026 draait een open MoE-model van Qwen of DeepSeek-V4-Flash-klasse (near-frontier reasoning) bruikbaar boven 20 tokens/sec lokaal op een Mac van maximaal 4000 euro
opensinds 2026-W22 · review na 2026-W34
Kosten-per-taak wordt binnen 2 kwartalen de dominante AI-inkooplens bij MKB
opensinds 2026-W21 · review na 2026-W30
Coding-tools-laag commoditiseert binnen ~12 maanden
bevestigdsinds 2026-W19 · review na 2026-W22
AI inside zakt als verkoopargument, human-led stijgt
het bewijs
HN-top "I'm Tired of Talking to AI" (W22 1724pt naar W23 2008pt) + DuckDuckGo +28% + AI-vrij als feature; herbevestigd W23; herbevestigd W24: "AI is slowing down" 613pt + zelfbewuste anti-AI-vraag 455pt; herbevestigd W26: Ford haalt ervaren mensen terug bij z'n agent-uitrol, bouwers willen de code-review aanscherpen, en de "AI verbrandt de toast, ik schraap 'm af"-stemming
bevestigdsinds 2026-W18 · review na 2026-W22
China haalt de bodem onder flagship-pricing weg
het bewijs
DeepSeek 75% korting permanent + Qwen Opus-niveau (W22); herbevestigd W23: DeepSeek-V4-Pro/Flash + Qwen3.6 voeren HF-trending aan (open-weights naderen flagship); herbevestigd W24: 25+ open modellen in 1 week, DeepSeek-V4-Pro #1 HF (4730), Google geeft Gemma 4 zelf open vrij; herbevestigd W26: Zhipu's open GLM-5.2 voert de open-model-ranglijst aan, juist nu de Amerikaanse topmodellen achter een overheidshek verdwijnen

~1 jaar6

opensinds 2026-W23 · review na 2027-W23
Voor 2027-W23 wordt minstens een top coding-tool (Cursor, Copilot, Windsurf of Claude Code) overgenomen of fundamenteel van 'tool' naar 'platform/agent' herpositioneerd
opensinds 2026-W23 · review na 2027-W23
Voor 2027-W23 brengt een grote partij (OpenAI, Anthropic, Google, Apple of Microsoft) een mainstream proactieve persoonlijke assistent die een fleet van agents aanstuurt
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 haalt de METR 50%-task-horizon taken die mensen minstens een volledige werkdag (8 uur) kosten, voor generalist-agents
opensinds 2026-W23 · review na 2028-W22
Voor 2028-W22 is er geen algemeen beschikbaar agent-product dat een NL-MKB-werknemerrol end-to-end vervangt met persistent leren over sessies, op productie-betrouwbaarheid (Karpathy continual-learning-test, human-moat-tracker)
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 ziet minstens een traditioneel NL-kwaliteitsmerk (Volkskrant, NRC of FD) een meetbare opleving in betalende abonnees of print-oplage, mede gedreven door deepfake-/fake-news-moeheid en 'geverifieerd door mensen' als waarde (flight to verified-human)
opensinds 2026-W23 · review na 2027-W52
Voor eind 2027 wordt parasociale AI-schade ('AI-psychose', ongezonde AI-afhankelijkheid) een erkende categorie in minstens een Westers land: een formele gezondheidsrichtlijn, klinische erkenning, of door een toezichthouder afgedwongen platform-maatregel

~3 jaar (horizon-watch)1

opensinds 2026-W23 · review na 2028-W52
Voor eind 2028 publiceert minstens een frontier-lab een geverifieerde, reproduceerbare autonome verbetering door een AI aan z'n eigen training of architectuur boven menselijke baseline (Clark 60%-scenario)