Alle edities

De AI Brief · week 24

Apple stopt Google's AI in de iPhone

Verder deze week: meer dan 25 open modellen in zeven dagen (nu ook Google's eigen), de AI-moeheid wordt zelfbewust, en je werkgeheugen wordt duurder door de AI-honger naar chips.

9 jun 2026 · de hele week · door een mens, AI als gereedschap

Waar staan we

Twee dingen liepen deze week uit elkaar. Het gevoel koelde verder af: "AI gaat langzamer" was een van de best gelezen stukken op Hacker News, en de techgemeenschap vroeg zich daar hardop af waarom ze zelf zo afwijzend is geworden. Tegelijk versnelde wat er gebouwd wordt. In één week kwamen er meer dan 25 open modellen uit, en Apple bleek z'n nieuwe Siri op de modellen van Google te bouwen in plaats van iets eigens.

Onder die twee verhalen schuift de rekening op naar onverwachte plekken. Uber zette een limiet van 1500 dollar per maand op AI-gebruik, en de prijs van werkgeheugen stijgt omdat de AI-datacenters de chips opkopen. De modellen worden gratis, maar het kost ergens anders.

En het gat tussen "het werkt" en "het is veilig" werd zichtbaar: duizenden Instagram-accounts werden gekaapt via Meta's AI-chatbot, en in Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden.

Wat er deze week schoof

wie aan de knoppen zit

Apple bouwt z'n nieuwe Siri op Google's Gemini

Op WWDC kondigde Apple "Siri AI" aan, gebouwd op Google's Gemini in plaats van een eigen model. Het draait in drie lagen: op het toestel zelf, via Apple's eigen privacy-cloud, en alleen de meest complexe taken gaan naar Google's cloud. Apple lanceert 'm voorlopig niet in de EU. Volgens berichten gaat het om een Gemini-model van 1,2 biljoen parameters en een deal van rond een miljard dollar per jaar. Het bedrijf dat privacy als merk voert, huurt z'n AI-brein in bij z'n grootste concurrent, en houdt het juist in Europa tegen.

Zelfs Apple bouwt niet alles zelf, en de vraag waar je AI fysiek draait, op het toestel, in een EU-cloud of bij een Amerikaanse reus, wordt een echte keuze.

voor wie het nakijkt

apple, google, gemini, wwdc, platform · heat: HN 660pt · WWDC 2026

wat er nu kan

Meer dan 25 open modellen in één week, nu ook Google's eigen

De open-modellengolf van vorige weken werd een stortvloed: in zeven dagen kwamen er meer dan 25 open modellen uit, aangevoerd door NVIDIA's Nemotron 3 Ultra en, opvallend, Google's eigen Gemma 4. DeepSeek-V4-Pro stond met afstand bovenaan de werkelijke interesse, en MiniMax M3 kwam als open model tot vlak onder het beste niveau. Een gesloten lab als Google geeft nu zelf een sterk model gratis weg.

Krachtige AI om zelf te draaien wordt elke week breder beschikbaar, ook van de grote merken, niet alleen van de uitdagers.

voor wie het nakijkt

open-weights, gemma, deepseek, frontier · heat: HF 4730 upvotes (DeepSeek-V4-Pro)

hoe het voelt

De AI-moeheid wordt een bubbel-vraag

De terugslag kreeg vorige weken taal, deze week werd 'ie financieel. "AI gaat langzamer" werd een van de best gelezen stukken op Hacker News, de techgemeenschap vroeg zich hardop af waarom ze zelf zo afwijzend is geworden, en op social ging het over een "vibe shift": tokenmaxxing is uit, Silicon Valley twijfelt. Op de voorspellingsmarkt staat de kans dat de AI-bubbel dit jaar barst op 22%, en een veelgedeelde post stelt dat "het gratis feest voorbij is nu de echte kosten zichtbaar worden". Het verhaal kantelt van moeheid naar openlijke twijfel of het rendeert.

De stemming kantelt van AI-moeheid naar de vraag of het wel oplevert, en "door mensen gemaakt" plus een aantoonbaar rendement winnen aan waarde.

voor wie het nakijkt

backlash, bubbel, hype-cycle, human-led · heat: HN 613pt · Polymarket 22%

werkt het echt

AI wint in het examenlokaal en de rechtszaal, maar de vaardigheid erodeert

Twee kanten van dezelfde medaille kwamen samen. In Berkeley kelderden de cijfers van informatica-studenten naarmate ze meer op AI leunden (ruim een derde zakte voor het inleidende vak), terwijl een Stanford-studie liet zien dat AI-antwoorden op juridische vragen in driekwart van de gevallen wonnen van die van professoren. AI presteert beter op de output, maar de onderliggende vaardigheid bij mensen brokkelt af. In Nederland gaf ING als eerste bank AI een grote rol bij het beoordelen van hypotheken.

AI levert sneller goede output, maar wie de onderliggende kennis kwijtraakt kan de fouten niet meer zien, en die controle is precies wat je inkoopt.

voor wie het nakijkt

onderwijs, juridisch, skill-erosie · heat: HN 830pt (Berkeley) + 416pt (Stanford)

wat het kost

De gratis modellen, de duurdere rekening

De modellen worden gratis, maar de rekening duikt elders op. Uber zette een limiet van 1500 dollar per maand op AI-gebruik per medewerker, een signaal dat bedrijven het verbruik gaan rantsoeneren. En de prijs van werkgeheugen schiet omhoog omdat de AI-datacenters de chips opkopen: 32GB werkgeheugen kost nu fors meer dan een jaar geleden. Zelf een model lokaal draaien is gratis qua software, maar de machine eronder wordt duurder.

De AI zelf wordt goedkoper, maar reken op een limiet of een hogere hardware-rekening, en stuur op kosten-per-taak in plaats van onbeperkt gebruik.

voor wie het nakijkt

kosten, hardware, geheugen · heat: HN 623pt (Uber) + 434pt (DDR5)

Deze week doen

Check of je AI-architectuur weet wáár elk model draait en onder welke wetgeving, nu zelfs Apple z'n AI in Europa terughoudt.

  • waarom nu: Apple lanceert z'n Gemini-Siri voorlopig niet in de EU, en de AI Act-agentregels komen in augustus. "Waar draait dit" wordt een inkoopvraag.
  • 5 min: noteer per AI-onderdeel in je stack welk model het is en in welke regio het draait.
  • 1 uur: markeer de onderdelen die persoonsdata raken en bepaal voor minstens één een EU-gehost of lokaal alternatief.

Gereedschapskist

  • google/gemma-4-12B-it (open weights) · hf · Google's eigen open model, sterk en gratis te draaien, goed om naast je gesloten model te testen.
  • JetBrains Mellum2-12B-Thinking · hf · open coding-model, goedkoop alternatief om in je routing te wisselen.
  • Anthropic defending-code-reference-harness · github · open raamwerk om met AI kwetsbaarheden in je eigen code te zoeken, relevant nu de hacks via AI toenemen.

Wat ik volg

  • als Apple Intelligence (Gemini) in de EU landt dan zie je hoe de privacy-architectuur eruitziet, een blauwdruk voor "AI met gevoelige data onder EU-wetgeving".
  • als de geheugen- en chipprijzen hoog blijven dan wordt lokaal AI draaien duurder dan de gratis modellen doen vermoeden, relevant voor wie on-prem overweegt.
  • als "AI gaat langzamer" een mainstream cover-verhaal wordt dan worden MKB-klanten voorzichtiger, en "kleine bewezen stappen" verkoopt beter dan "kijk hoe slim".

Mijn voorspellingen

  • P-2026-W19-1 "AI inside zakt, human-led stijgt" · bevestigd (sinds W19) · herbevestigd W24: "AI is slowing down" 613pt + de zelfbewuste anti-AI-vraag 455pt.
  • P-2026-W18-1 "China haalt de bodem onder flagship-pricing" · bevestigd (sinds W18) · herbevestigd W24: 25+ open modellen in een week, DeepSeek-V4-Pro voert de interesse aan, Google sluit aan met open Gemma 4.
  • P-2026-W23-7 "Apple bevestigt Gemini-Siri via z'n privacy-cloud als GDPR-argument" · open (sinds W23, due W52) · beweegt sterk: Apple toonde op WWDC een drie-lagen-Siri met een eigen privacy-cloud-laag naast Google, alleen de expliciete GDPR-framing als verkoopargument ontbreekt nog.
  • P-2026-W23-2 "Open-weights model in top-3 SWE-Bench Pro voor W36" · open (sinds W23, due W36) · bewijs stapelt: MiniMax M3 op 54.7 van de Intelligence-index.
  • P-2026-W24-1 "Werkgeheugen blijft duur (32GB DDR5 boven ~250 euro) tot eind 2026 door AI-datacentervraag, wat lokaal AI draaien minder goedkoop maakt dan de gratis modellen suggereren" · open (nieuw, due W40).

Wat mij ongelijk zou geven

Als "AI gaat langzamer" puur sentiment blijkt en de capability-cijfers het tegenspreken. Deze week géén schoon tegenbewijs: de open-modellengolf (25 in een week) en AI dat rechtsprofessoren verslaat tonen juist dat het bouwen versnelt terwijl het gevoel afkoelt. Dat gat is het signaal, niet de afkoeling zelf.

Essay-kandidaten

  • macht · Apple huurt z'n AI-brein in bij Google: sterke counter (het privacy-merk kiest de concurrent én houdt het uit de EU) + raakt elke MKB'er die zich afvraagt waar z'n AI draait. Verse angle: "wie geen eigen model heeft, koopt afhankelijkheid, en waar dat draait wordt jouw verantwoordelijkheid".
  • praktijk · AI wint de output, de vaardigheid erodeert: Berkeley-cijfers + Stanford-juristen geven een concrete counter op "AI maakt ons gewoon beter". Angle: de waarde verschuift naar wie de fouten nog kan zien.

Bewust NIET als verse essay: de stemming · AI-moeheid is al gedekt door de Notitie + de W23 deep-dive. Sterk signaal deze week ("AI gaat langzamer"), maar geen nieuw verhaal, hooguit een update-regel.

Wat ik je bespaar

  • De arXiv-stroom (50 papers, world-models/continual-learning/agents): academisch, geen MKB-haak deze week.
  • De US-AI-politiek (Trump's afgezwakte AI-order, het voorstel om staatswetten 3 jaar te bevriezen): relevant voor het grote plaatje, maar niet actiebaar voor NL/EU-MKB deze week.
  • AI-securityincidenten in detail (Meta Instagram-kaping, Microsoft-tools gehackt): belangrijk signaal dat AI een aanvalsoppervlak wordt, maar de losse incidenten zijn nieuws, geen actie. De les zit in de Gereedschapskist (zoek kwetsbaarheden in je eigen code).
  • De ISS-luchtlek + Smart-TV-scraping: hoog op HN, geen AI-MKB-relevantie.

Mijn voorspellingen

Wat ik denk dat er gaat gebeuren in AI, en hoe het uitpakt. Ook als ik ongelijk had.

2 bevestigd15 open0 weerlegd
Op korte termijn6
  • opensinds 2026-W23 · review na 2026-W36

    EU-gehoste of on-prem AI wordt voor eind W36 een expliciete inkoop- of architectuurfactor in minstens een gevoelige-data-sector (juridisch/zorg/finance) in NL/EU, gedreven door AI Act-agentregels (augustus) plus Europese compute

  • opensinds 2026-W23 · review na 2026-W36

    Voor eind 2026-W36 staat een open-weights model (DeepSeek, Qwen of StepFun) in de top-3 van SWE-Bench Pro, op closed-flagship-niveau

  • opensinds 2026-W22 · review na 2026-W34

    Kosten-per-taak wordt binnen 2 kwartalen de dominante AI-inkooplens bij MKB

  • opensinds 2026-W21 · review na 2026-W30

    Coding-tools-laag commoditiseert binnen ~12 maanden

  • bevestigdsinds 2026-W19 · review na 2026-W22

    AI inside zakt als verkoopargument, human-led stijgt

    het bewijs

    HN-top "I'm Tired of Talking to AI" (W22 1724pt naar W23 2008pt) + DuckDuckGo +28% + AI-vrij als feature; herbevestigd W23

  • bevestigdsinds 2026-W18 · review na 2026-W22

    China haalt de bodem onder flagship-pricing weg

    het bewijs

    DeepSeek 75% korting permanent + Qwen Opus-niveau (W22); herbevestigd W23: DeepSeek-V4-Pro/Flash + Qwen3.6 voeren HF-trending aan (open-weights naderen flagship)

~1 jaar10
  • opensinds 2026-W23 · review na 2026-W52

    Voor eind 2026 voert minstens een mainstream NL/EU-merk 'door mensen gemaakt' of 'AI-vrij' actief als verkoopargument (label, campagne of premium-tier)

  • opensinds 2026-W23 · review na 2026-W52

    Voor eind 2026 wordt 'AI-investeringen leveren nog niet op' een dominant mainstream-narratief op cover-story-niveau, wat MKB voorzichtiger maakt

  • opensinds 2026-W23 · review na 2027-W23

    Voor 2027-W23 wordt minstens een top coding-tool (Cursor, Copilot, Windsurf of Claude Code) overgenomen of fundamenteel van 'tool' naar 'platform/agent' herpositioneerd

  • opensinds 2026-W23 · review na 2027-W23

    Voor 2027-W23 brengt een grote partij (OpenAI, Anthropic, Google, Apple of Microsoft) een mainstream proactieve persoonlijke assistent die een fleet van agents aanstuurt

  • opensinds 2026-W23 · review na 2026-W52

    Voor eind 2026 bevestigt Apple publiekelijk dat de Gemini-Siri-inferentie via Apple's Private Cloud Compute loopt (niet rauw naar Google), als GDPR-relevant verkoopargument

  • opensinds 2026-W23 · review na 2026-W52

    Voor eind 2026 draait een open MoE-model van Qwen of DeepSeek-V4-Flash-klasse (near-frontier reasoning) bruikbaar boven 20 tokens/sec lokaal op een Mac van maximaal 4000 euro

  • opensinds 2026-W23 · review na 2027-W52

    Voor eind 2027 haalt de METR 50%-task-horizon taken die mensen minstens een volledige werkdag (8 uur) kosten, voor generalist-agents

  • opensinds 2026-W23 · review na 2028-W22

    Voor 2028-W22 is er geen algemeen beschikbaar agent-product dat een NL-MKB-werknemerrol end-to-end vervangt met persistent leren over sessies, op productie-betrouwbaarheid (Karpathy continual-learning-test, human-moat-tracker)

  • opensinds 2026-W23 · review na 2027-W52

    Voor eind 2027 ziet minstens een traditioneel NL-kwaliteitsmerk (Volkskrant, NRC of FD) een meetbare opleving in betalende abonnees of print-oplage, mede gedreven door deepfake-/fake-news-moeheid en 'geverifieerd door mensen' als waarde (flight to verified-human)

  • opensinds 2026-W23 · review na 2027-W52

    Voor eind 2027 wordt parasociale AI-schade ('AI-psychose', ongezonde AI-afhankelijkheid) een erkende categorie in minstens een Westers land: een formele gezondheidsrichtlijn, klinische erkenning, of door een toezichthouder afgedwongen platform-maatregel

~3 jaar (horizon-watch)1
  • opensinds 2026-W23 · review na 2028-W52

    Voor eind 2028 publiceert minstens een frontier-lab een geverifieerde, reproduceerbare autonome verbetering door een AI aan z'n eigen training of architectuur boven menselijke baseline (Clark 60%-scenario)