De AI Brief · week 24
Apple stopt Google's AI in de iPhone
Verder deze week: meer dan 25 open modellen in zeven dagen (nu ook Google's eigen), de AI-moeheid wordt zelfbewust, en je werkgeheugen wordt duurder door de AI-honger naar chips.
Waar staan we
Twee dingen liepen deze week uit elkaar. Het gevoel koelde verder af: "AI gaat langzamer" was een van de best gelezen stukken op Hacker News, en de techgemeenschap vroeg zich daar hardop af waarom ze zelf zo afwijzend is geworden. Tegelijk versnelde wat er gebouwd wordt. In één week kwamen er meer dan 25 open modellen uit, en Apple bleek z'n nieuwe Siri op de modellen van Google te bouwen in plaats van iets eigens.
Onder die twee verhalen schuift de rekening op naar onverwachte plekken. Uber zette een limiet van 1500 dollar per maand op AI-gebruik, en de prijs van werkgeheugen stijgt omdat de AI-datacenters de chips opkopen. De modellen worden gratis, maar het kost ergens anders.
En het gat tussen "het werkt" en "het is veilig" werd zichtbaar: duizenden Instagram-accounts werden gekaapt via Meta's AI-chatbot, en in Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden.
Wat er deze week schoof
wie aan de knoppen zit
Apple bouwt z'n nieuwe Siri op Google's Gemini
Op WWDC kondigde Apple "Siri AI" aan, gebouwd op Google's Gemini in plaats van een eigen model. Het draait in drie lagen: op het toestel zelf, via Apple's eigen privacy-cloud, en alleen de meest complexe taken gaan naar Google's cloud. Apple lanceert 'm voorlopig niet in de EU. Volgens berichten gaat het om een Gemini-model van 1,2 biljoen parameters en een deal van rond een miljard dollar per jaar. Het bedrijf dat privacy als merk voert, huurt z'n AI-brein in bij z'n grootste concurrent, en houdt het juist in Europa tegen.
Zelfs Apple bouwt niet alles zelf, en de vraag waar je AI fysiek draait, op het toestel, in een EU-cloud of bij een Amerikaanse reus, wordt een echte keuze.
- verder lezen: WIRED: Apple's New Siri AI Is Ready to Get Personal · ~6 min · wat de drie-lagen-architectuur betekent
voor wie het nakijkt
apple, google, gemini, wwdc, platform · heat: HN 660pt · WWDC 2026
- bewijs: officieel op WWDC 2026, Siri AI op Gemini · drie-lagen-routing (toestel / Apple privacy-cloud / Google-cloud voor complexe taken) · geen EU-launch bij release · gerapporteerd: 1,2T-model, ~1 mld dollar per jaar
- bronnen: Apple reveals new AI architecture built around Google Gemini ·
hn· Apple's New Siri AI Is Ready to Get Personal (WIRED) ·web· Gemini-partnership nu officieel (MacObserver) ·web· Apple introduces Siri AI ·primary
wat er nu kan
Meer dan 25 open modellen in één week, nu ook Google's eigen
De open-modellengolf van vorige weken werd een stortvloed: in zeven dagen kwamen er meer dan 25 open modellen uit, aangevoerd door NVIDIA's Nemotron 3 Ultra en, opvallend, Google's eigen Gemma 4. DeepSeek-V4-Pro stond met afstand bovenaan de werkelijke interesse, en MiniMax M3 kwam als open model tot vlak onder het beste niveau. Een gesloten lab als Google geeft nu zelf een sterk model gratis weg.
Krachtige AI om zelf te draaien wordt elke week breder beschikbaar, ook van de grote merken, niet alleen van de uitdagers.
- verder lezen: JetBrains Mellum2-12B-Thinking · ~4 min · open coding-model · LiquidAI LFM2.5-8B-A1B · ~3 min · klein en efficiënt
voor wie het nakijkt
open-weights, gemma, deepseek, frontier · heat: HF 4730 upvotes (DeepSeek-V4-Pro)
- bewijs: 25+ open modellen in 1 week · DeepSeek-V4-Pro 4730 HF-upvotes · Gemma 4 (Google, open) 784 · MiniMax M3 54.7 op de Artificial Analysis-index
- bronnen: 25+ open-weight models in één week, NVIDIA Nemotron 3 Ultra + Google Gemma 4 ·
x· DeepSeek-V4-Pro op HF ·hf· google/gemma-4-12B-it ·hf· MiniMax M3 54.7 op de Intelligence-index ·x
hoe het voelt
De AI-moeheid wordt een bubbel-vraag
De terugslag kreeg vorige weken taal, deze week werd 'ie financieel. "AI gaat langzamer" werd een van de best gelezen stukken op Hacker News, de techgemeenschap vroeg zich hardop af waarom ze zelf zo afwijzend is geworden, en op social ging het over een "vibe shift": tokenmaxxing is uit, Silicon Valley twijfelt. Op de voorspellingsmarkt staat de kans dat de AI-bubbel dit jaar barst op 22%, en een veelgedeelde post stelt dat "het gratis feest voorbij is nu de echte kosten zichtbaar worden". Het verhaal kantelt van moeheid naar openlijke twijfel of het rendeert.
De stemming kantelt van AI-moeheid naar de vraag of het wel oplevert, en "door mensen gemaakt" plus een aantoonbaar rendement winnen aan waarde.
- verder lezen: AI is slowing down (Ed Zitron) · ~12 min · het bubbel-argument, scherp en omstreden
voor wie het nakijkt
backlash, bubbel, hype-cycle, human-led · heat: HN 613pt · Polymarket 22%
- bewijs: "AI is slowing down" HN 613pt · Polymarket 22% kans bubbel barst voor jaareind · "vibe shift is real, tokenmaxxing dies out" (Mashable) · @Telegraph "the free lunch is over" 3.571 likes
- bronnen: AI is slowing down (Ed Zitron) ·
hn· Why is the HN crowd so anti-AI? ·hn· The AI vibe shift is real (Mashable) ·web· The AI hype cycle will slow down (TNW) ·web
werkt het echt
AI wint in het examenlokaal en de rechtszaal, maar de vaardigheid erodeert
Twee kanten van dezelfde medaille kwamen samen. In Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden (ruim een derde zakte voor het inleidende vak), terwijl een Stanford-studie liet zien dat AI-antwoorden op juridische vragen in driekwart van de gevallen wonnen van die van professoren. AI presteert beter op de output, maar de onderliggende vaardigheid bij mensen brokkelt af. In Nederland gaf ING als eerste bank AI een grote rol bij het beoordelen van hypotheken.
AI levert sneller goede output, maar wie de onderliggende kennis kwijtraakt kan de fouten niet meer zien, en die controle is precies wat je inkoopt.
- verder lezen: Mathematicians issue warning as AI gains ground · ~6 min · dezelfde spanning in de wiskunde
voor wie het nakijkt
onderwijs, juridisch, skill-erosie · heat: HN 830pt (Berkeley) + 416pt (Stanford)
- bewijs: Berkeley 35,3% F's in inleidend CS-vak · Stanford AI wint 75% van juridische vergelijkingen (~3000 blinde beoordelingen) · ING zet AI in bij hypotheekbeoordeling
- bronnen: Failing grades soar with AI usage at Berkeley CS ·
hn· AI outperforms law professors, Stanford ·hn· ING geeft AI grote rol bij hypotheekbeoordeling ·nl· Wolters Kluwer en OpenAI, analisten sceptisch ·nl
wat het kost
De gratis modellen, de duurdere rekening
De modellen worden gratis, maar de rekening duikt elders op. Uber zette een limiet van 1500 dollar per maand op AI-gebruik per medewerker, een signaal dat bedrijven het verbruik gaan rantsoeneren. En de prijs van werkgeheugen schiet omhoog omdat de AI-datacenters de chips opkopen: 32GB werkgeheugen kost nu fors meer dan een jaar geleden. Zelf een model lokaal draaien is gratis qua software, maar de machine eronder wordt duurder.
De AI zelf wordt goedkoper, maar reken op een limiet of een hogere hardware-rekening, en stuur op kosten-per-taak in plaats van onbeperkt gebruik.
- verder lezen: Uber caps usage, Willison's analyse · ~4 min · waarom dit een prijssignaal is
voor wie het nakijkt
kosten, hardware, geheugen · heat: HN 623pt (Uber) + 434pt (DDR5)
- bewijs: Uber-limiet 1500 dollar/maand/medewerker · 32GB DDR5 nu rond 375 dollar minimum (was ~100 dollar een jaar terug) · "Corporate America rantsoeneert AI"
- bronnen: Uber's $1,500/month AI limit (Simon Willison) ·
hn· 32GB DDR5 nu 375 dollar, AI-tekort knijpt PC-bouw ·hn
Deze week doen
Check of je AI-architectuur weet wáár elk model draait en onder welke wetgeving, nu zelfs Apple z'n AI in Europa terughoudt.
- waarom nu: Apple lanceert z'n Gemini-Siri voorlopig niet in de EU, en de AI Act-agentregels komen in augustus. "Waar draait dit" wordt een inkoopvraag.
- 5 min: noteer per AI-onderdeel in je stack welk model het is en in welke regio het draait.
- 1 uur: markeer de onderdelen die persoonsdata raken en bepaal voor minstens één een EU-gehost of lokaal alternatief.
Gereedschapskist
- google/gemma-4-12B-it (open weights) · hf · Google's eigen open model, sterk en gratis te draaien, goed om naast je gesloten model te testen.
- JetBrains Mellum2-12B-Thinking · hf · open coding-model, goedkoop alternatief om in je routing te wisselen.
- Anthropic defending-code-reference-harness · github · open raamwerk om met AI kwetsbaarheden in je eigen code te zoeken, relevant nu de hacks via AI toenemen.
Wat ik volg
- als Apple Intelligence (Gemini) in de EU landt → dan zie je hoe de privacy-architectuur eruitziet, een blauwdruk voor "AI met gevoelige data onder EU-wetgeving".
- als de geheugen- en chipprijzen hoog blijven → dan wordt lokaal AI draaien duurder dan de gratis modellen doen vermoeden, relevant voor wie on-prem overweegt.
- als "AI gaat langzamer" een mainstream cover-verhaal wordt → dan worden MKB-klanten voorzichtiger, en "kleine bewezen stappen" verkoopt beter dan "kijk hoe slim".
Mijn voorspellingen
- P-2026-W19-1 "AI inside zakt, human-led stijgt" · bevestigd (sinds W19) · herbevestigd W24: "AI is slowing down" 613pt + de zelfbewuste anti-AI-vraag 455pt.
- P-2026-W18-1 "China haalt de bodem onder flagship-pricing" · bevestigd (sinds W18) · herbevestigd W24: 25+ open modellen in een week, DeepSeek-V4-Pro voert de interesse aan, Google sluit aan met open Gemma 4.
- P-2026-W23-7 "Apple bevestigt Gemini-Siri via z'n privacy-cloud als GDPR-argument" · open (sinds W23, due W52) · beweegt sterk: Apple toonde op WWDC een drie-lagen-Siri met een eigen privacy-cloud-laag naast Google, alleen de expliciete GDPR-framing als verkoopargument ontbreekt nog.
- P-2026-W23-2 "Open-weights model in top-3 SWE-Bench Pro voor W36" · open (sinds W23, due W36) · bewijs stapelt: MiniMax M3 op 54.7 van de Intelligence-index.
- P-2026-W24-1 "Werkgeheugen blijft duur (32GB DDR5 boven ~250 euro) tot eind 2026 door AI-datacentervraag, wat lokaal AI draaien minder goedkoop maakt dan de gratis modellen suggereren" · open (nieuw, due W40).
Wat mij ongelijk zou geven
Als "AI gaat langzamer" puur sentiment blijkt en de capability-cijfers het tegenspreken. Deze week géén schoon tegenbewijs: de open-modellengolf (25 in een week) en AI dat rechtsprofessoren verslaat tonen juist dat het bouwen versnelt terwijl het gevoel afkoelt. Dat gat is het signaal, niet de afkoeling zelf.
Essay-kandidaten
- macht · Apple huurt z'n AI-brein in bij Google: sterke counter (het privacy-merk kiest de concurrent én houdt het uit de EU) + raakt elke MKB'er die zich afvraagt waar z'n AI draait. Verse angle: "wie geen eigen model heeft, koopt afhankelijkheid, en waar dat draait wordt jouw verantwoordelijkheid".
- praktijk · AI wint de output, de vaardigheid erodeert: Berkeley-cijfers + Stanford-juristen geven een concrete counter op "AI maakt ons gewoon beter". Angle: de waarde verschuift naar wie de fouten nog kan zien.
Bewust NIET als verse essay: de stemming · AI-moeheid is al gedekt door de Notitie + de W23 deep-dive. Sterk signaal deze week ("AI gaat langzamer"), maar geen nieuw verhaal, hooguit een update-regel.
Wat ik je bespaar
- De arXiv-stroom (50 papers, world-models/continual-learning/agents): academisch, geen MKB-haak deze week.
- De US-AI-politiek (Trump's afgezwakte AI-order, het voorstel om staatswetten 3 jaar te bevriezen): relevant voor het grote plaatje, maar niet actiebaar voor NL/EU-MKB deze week.
- AI-securityincidenten in detail (Meta Instagram-kaping, Microsoft-tools gehackt): belangrijk signaal dat AI een aanvalsoppervlak wordt, maar de losse incidenten zijn nieuws, geen actie. De les zit in de Gereedschapskist (zoek kwetsbaarheden in je eigen code).
- De ISS-luchtlek + Smart-TV-scraping: hoog op HN, geen AI-MKB-relevantie.
Mijn voorspellingen
Wat ik denk dat er gaat gebeuren in AI, en hoe het uitpakt. Ook als ik ongelijk had.
Op korte termijn6
- open
EU-gehoste of on-prem AI wordt voor eind W36 een expliciete inkoop- of architectuurfactor in minstens een gevoelige-data-sector (juridisch/zorg/finance) in NL/EU, gedreven door AI Act-agentregels (augustus) plus Europese compute
- open
Voor eind 2026-W36 staat een open-weights model (DeepSeek, Qwen of StepFun) in de top-3 van SWE-Bench Pro, op closed-flagship-niveau
- open
Kosten-per-taak wordt binnen 2 kwartalen de dominante AI-inkooplens bij MKB
- open
Coding-tools-laag commoditiseert binnen ~12 maanden
- bevestigd
AI inside zakt als verkoopargument, human-led stijgt
het bewijs
HN-top "I'm Tired of Talking to AI" (W22 1724pt naar W23 2008pt) + DuckDuckGo +28% + AI-vrij als feature; herbevestigd W23
- bevestigd
China haalt de bodem onder flagship-pricing weg
het bewijs
DeepSeek 75% korting permanent + Qwen Opus-niveau (W22); herbevestigd W23: DeepSeek-V4-Pro/Flash + Qwen3.6 voeren HF-trending aan (open-weights naderen flagship)
~1 jaar10
- open
Voor eind 2026 voert minstens een mainstream NL/EU-merk 'door mensen gemaakt' of 'AI-vrij' actief als verkoopargument (label, campagne of premium-tier)
- open
Voor eind 2026 wordt 'AI-investeringen leveren nog niet op' een dominant mainstream-narratief op cover-story-niveau, wat MKB voorzichtiger maakt
- open
Voor 2027-W23 wordt minstens een top coding-tool (Cursor, Copilot, Windsurf of Claude Code) overgenomen of fundamenteel van 'tool' naar 'platform/agent' herpositioneerd
- open
Voor 2027-W23 brengt een grote partij (OpenAI, Anthropic, Google, Apple of Microsoft) een mainstream proactieve persoonlijke assistent die een fleet van agents aanstuurt
- open
Voor eind 2026 bevestigt Apple publiekelijk dat de Gemini-Siri-inferentie via Apple's Private Cloud Compute loopt (niet rauw naar Google), als GDPR-relevant verkoopargument
- open
Voor eind 2026 draait een open MoE-model van Qwen of DeepSeek-V4-Flash-klasse (near-frontier reasoning) bruikbaar boven 20 tokens/sec lokaal op een Mac van maximaal 4000 euro
- open
Voor eind 2027 haalt de METR 50%-task-horizon taken die mensen minstens een volledige werkdag (8 uur) kosten, voor generalist-agents
- open
Voor 2028-W22 is er geen algemeen beschikbaar agent-product dat een NL-MKB-werknemerrol end-to-end vervangt met persistent leren over sessies, op productie-betrouwbaarheid (Karpathy continual-learning-test, human-moat-tracker)
- open
Voor eind 2027 ziet minstens een traditioneel NL-kwaliteitsmerk (Volkskrant, NRC of FD) een meetbare opleving in betalende abonnees of print-oplage, mede gedreven door deepfake-/fake-news-moeheid en 'geverifieerd door mensen' als waarde (flight to verified-human)
- open
Voor eind 2027 wordt parasociale AI-schade ('AI-psychose', ongezonde AI-afhankelijkheid) een erkende categorie in minstens een Westers land: een formele gezondheidsrichtlijn, klinische erkenning, of door een toezichthouder afgedwongen platform-maatregel
~3 jaar (horizon-watch)1
- open
Voor eind 2028 publiceert minstens een frontier-lab een geverifieerde, reproduceerbare autonome verbetering door een AI aan z'n eigen training of architectuur boven menselijke baseline (Clark 60%-scenario)