AI-native Architectuur

4 min read

Caching, retries, validatie, testen — het gaat er allemaal van uit dat dezelfde input dezelfde output oplevert. AI doorbreekt die aanname. En wanneer klanten agentic workflows bovenop AI inzetten, breekt er een tweede aanname mee — dat een mens degene is die reads en writes triggert. De architectuur die op beide aannames is gebouwd, breekt mee.

Wat wij waarnemen

De meeste systemen in productie zijn gebouwd op een aanname die zo basaal is dat ze nooit is opgeschreven: dezelfde input levert dezelfde output op. Caching, idempotency keys, retry logic, validatie, geautomatiseerd testen — het hangt allemaal af van determinisme. Roep een functie twee keer aan met dezelfde argumenten, en je krijgt twee keer hetzelfde resultaat.

LLM's werken niet zo. Dezelfde prompt, twee keer verstuurd, kan twee verschillende antwoorden opleveren. Confidence varieert. Formulering varieert. Correctheid kan variëren. Een systeem dat is ontworpen rond deterministisch gedrag heeft geen natuurlijke plek voor die variabiliteit — dus wordt die er als uitzondering bijgeplakt, of genegeerd totdat ze een incident veroorzaakt.

Dit is de eerste breuklijn. Een tweede versterkt die.

De fundamentele aanname van elk systeem dat in de afgelopen twee decennia is gebouwd, is dat er aan de andere kant van elk verzoek een mens zit. API rate limits, datamodellen, infrastructuurdimensionering, pricing — alles was afgestemd op interactie op menselijk tempo.

Wanneer een agent de mens vervangt, breekt die tweede aanname gelijktijdig op al die lagen. Het systeem kan nog steeds functioneren, maar het was niet ontworpen voor een niet-menselijke, niet-deterministische actor als primaire gebruiker.

Dit speelt in twee richtingen:

  • Als u een product bouwt — uw interne architectuur was ontworpen voor deterministische belasting op menselijk tempo. Probabilistische outputs en agentic workflows die binnen uw eigen systemen draaien, leggen dat plafond samen bloot, niet los van elkaar.
  • Als u SaaS-producten gebruikt — de tools waarvan uw teams afhankelijk zijn, waren ontworpen voor deterministische consumptie op menselijk tempo. Uw agents zullen die APIs belasten met variabele outputs, op een schaal die de leverancier nooit heeft voorzien.

In al deze situaties is het patroon consistent: de beperkende factor is niet het modelvermogen — het is een architectuur gebouwd op aannames die probabilistische, agent-gedreven systemen niet langer waarmaken.

De kosten

  • Caching- en idempotency-logica die stilletjes breekt omdat outputs variëren
  • Validatie- en teststrategieën gebouwd voor deterministische resultaten
  • Stijgende infrastructuurkosten doordat belastingpatronen onverwacht veranderen
  • Performance-knelpunten op plekken die nooit als risico waren geïdentificeerd
  • Gefragmenteerde systemen die geen context kunnen delen tussen agent-workflows
  • Beperkte schaalbaarheid en flexibiliteit
  • SaaS-afhankelijkheden die een plafond worden voor agentic doorvoer

Hoe dit gewoonlijk wordt opgelost

  • Niet-deterministische aanroepen verpakken in deterministisch ogende interfaces
  • AI-functionaliteit toevoegen aan bestaande systemen zonder de kernaannames te herzien
  • Geïsoleerde AI-diensten bouwen
  • Infrastructuur opschalen om nieuwe belasting op te vangen
  • Incrementele fixes voor performance-problemen

Levert functionaliteit op, maar vergroot fragmentatie en complexiteit.

De architecturale aannames eronder — deterministische output, een mens als triggerende eenheid — worden nooit aangepakt. Elke fix is daardoor tijdelijk.

AI-versterking

Probabilistische output is beheersbaar wanneer een mens elk resultaat controleert voordat het ertoe doet. Een net iets andere formulering, een antwoord met lagere confidence, een edge case die het model vreemd afhandelde — iemand merkt het op, past het aan, gaat verder. Die controlestap is wat de eerste breuklijn zo lang houdbaar maakte.

Agentic workflows verwijderen die stap. Wanneer organisaties agents direct laten handelen op AI-output, stroomt de variabiliteit die een mens vroeger opving nu rechtstreeks het systeem in. Niemand leest elk antwoord nog voordat het de volgende actie triggert.

De twee breuklijnen bestaan niet alleen naast elkaar — ze versterken elkaar. Zonder mens in de loop is probabilistische output niet langer een kwaliteitskwestie om te beoordelen. Het is een input die het systeem correct moet afhandelen, elke keer, op een schaal en in een tempo dat geen mens zou kunnen beoordelen, ook al zou dat gevraagd worden.

De belasting is niet alleen hoger — die is structureel anders:

  • Verzoeken komen in bursts binnen, niet in sequenties op menselijk tempo
  • Elk antwoord in die burst kan variëren, zonder dat iets stroomafwaarts dit opvangt
  • Context moet stromen tussen agent-acties, en die variabiliteit met zich meedragen
  • Het systeem wordt verwacht betrouwbaar te reageren zonder dat een mens de output of het belastingpatroon controleert

Complexiteit groeit niet geleidelijk. Ze verandert van aard zodra de variabiliteit die de mens vroeger opving nergens meer heen kan.

Na de SHIFT

  • Systemen ontworpen met probabilistische output als eersteklas ontwerpprincipe, niet als deterministische aanname met AI erbij geplakt
  • Systemen ontworpen voor machines als volwaardige actoren, niet als nagedachte
  • APIs, datamodellen en infrastructuur gedimensioneerd voor variabele output op agent-tempo
  • Voorspelbare performance en kosten onder continue, parallelle belasting, ook wanneer individuele outputs niet voorspelbaar zijn
  • Snellere innovatiecycli op een fundament dat niet vervangen hoeft te worden bij elke vooruitgang in modelvermogen
  • Een duurzame positie — voor zowel SaaS-aanbieders als SaaS-gebruikers
Shift Advisory
Bouw systemen die schalen met intelligentie, niet met complexiteit.