AI-native Architectuur

4 min read

Caching, retries, validatie, testen — het gaat er allemaal van uit dat dezelfde input dezelfde output oplevert. AI doorbreekt die aanname. En wanneer klanten agentic workflows bovenop AI inzetten, breekt er een tweede aanname mee — dat een mens degene is die reads en writes triggert. De architectuur die op beide aannames is gebouwd, breekt mee.

Wat wij waarnemen

De meeste systemen in productie zijn gebouwd op een aanname die zo basaal is dat ze nooit is opgeschreven: dezelfde input levert dezelfde output op. Caching, idempotency keys, retry logic, validatie, geautomatiseerd testen — het hangt allemaal af van determinisme. Roep een functie twee keer aan met dezelfde argumenten, en je krijgt twee keer hetzelfde resultaat.

LLM's werken niet zo. Dezelfde prompt, twee keer verstuurd, kan twee verschillende antwoorden opleveren. Confidence varieert. Formulering varieert. Correctheid kan variëren. Een systeem dat is ontworpen rond deterministisch gedrag heeft geen natuurlijke plek voor die variabiliteit — dus wordt die er als uitzondering bijgeplakt, of genegeerd totdat ze een incident veroorzaakt.

Dit is de eerste breuklijn. Een tweede versterkt die.

De fundamentele aanname van elk systeem dat in de afgelopen twee decennia is gebouwd, is dat er aan de andere kant van elk verzoek een mens zit. API rate limits, datamodellen, infrastructuurdimensionering, pricing — alles was afgestemd op interactie op menselijk tempo.

Wanneer een agent de mens vervangt, breekt die tweede aanname gelijktijdig op al die lagen. Het systeem kan nog steeds functioneren, maar het was niet ontworpen voor een niet-menselijke, niet-deterministische actor als primaire gebruiker.

Dit speelt in twee richtingen:

Als u een product bouwt — uw interne architectuur was ontworpen voor deterministische belasting op menselijk tempo. Probabilistische outputs en agentic workflows die binnen uw eigen systemen draaien, leggen dat plafond samen bloot, niet los van elkaar.
Als u SaaS-producten gebruikt — de tools waarvan uw teams afhankelijk zijn, waren ontworpen voor deterministische consumptie op menselijk tempo. Uw agents zullen die APIs belasten met variabele outputs, op een schaal die de leverancier nooit heeft voorzien.

In al deze situaties is het patroon consistent: de beperkende factor is niet het modelvermogen — het is een architectuur gebouwd op aannames die probabilistische, agent-gedreven systemen niet langer waarmaken.

De kosten

Caching- en idempotency-logica die stilletjes breekt omdat outputs variëren
Validatie- en teststrategieën gebouwd voor deterministische resultaten
Stijgende infrastructuurkosten doordat belastingpatronen onverwacht veranderen
Performance-knelpunten op plekken die nooit als risico waren geïdentificeerd
Gefragmenteerde systemen die geen context kunnen delen tussen agent-workflows
Beperkte schaalbaarheid en flexibiliteit
SaaS-afhankelijkheden die een plafond worden voor agentic doorvoer

Hoe dit gewoonlijk wordt opgelost

Niet-deterministische aanroepen verpakken in deterministisch ogende interfaces
AI-functionaliteit toevoegen aan bestaande systemen zonder de kernaannames te herzien
Geïsoleerde AI-diensten bouwen
Infrastructuur opschalen om nieuwe belasting op te vangen
Incrementele fixes voor performance-problemen

Levert functionaliteit op, maar vergroot fragmentatie en complexiteit.

De architecturale aannames eronder — deterministische output, een mens als triggerende eenheid — worden nooit aangepakt. Elke fix is daardoor tijdelijk.

AI-versterking

Probabilistische output is beheersbaar wanneer een mens elk resultaat controleert voordat het ertoe doet. Een net iets andere formulering, een antwoord met lagere confidence, een edge case die het model vreemd afhandelde — iemand merkt het op, past het aan, gaat verder. Die controlestap is wat de eerste breuklijn zo lang houdbaar maakte.

Agentic workflows verwijderen die stap. Wanneer organisaties agents direct laten handelen op AI-output, stroomt de variabiliteit die een mens vroeger opving nu rechtstreeks het systeem in. Niemand leest elk antwoord nog voordat het de volgende actie triggert.

De twee breuklijnen bestaan niet alleen naast elkaar — ze versterken elkaar. Zonder mens in de loop is probabilistische output niet langer een kwaliteitskwestie om te beoordelen. Het is een input die het systeem correct moet afhandelen, elke keer, op een schaal en in een tempo dat geen mens zou kunnen beoordelen, ook al zou dat gevraagd worden.

De belasting is niet alleen hoger — die is structureel anders:

Verzoeken komen in bursts binnen, niet in sequenties op menselijk tempo
Elk antwoord in die burst kan variëren, zonder dat iets stroomafwaarts dit opvangt
Context moet stromen tussen agent-acties, en die variabiliteit met zich meedragen
Het systeem wordt verwacht betrouwbaar te reageren zonder dat een mens de output of het belastingpatroon controleert

Complexiteit groeit niet geleidelijk. Ze verandert van aard zodra de variabiliteit die de mens vroeger opving nergens meer heen kan.

Na de SHIFT

Systemen ontworpen met probabilistische output als eersteklas ontwerpprincipe, niet als deterministische aanname met AI erbij geplakt
Systemen ontworpen voor machines als volwaardige actoren, niet als nagedachte
APIs, datamodellen en infrastructuur gedimensioneerd voor variabele output op agent-tempo
Voorspelbare performance en kosten onder continue, parallelle belasting, ook wanneer individuele outputs niet voorspelbaar zijn
Snellere innovatiecycli op een fundament dat niet vervangen hoeft te worden bij elke vooruitgang in modelvermogen
Een duurzame positie — voor zowel SaaS-aanbieders als SaaS-gebruikers

Bouw systemen die schalen met intelligentie, niet met complexiteit.