Winkelmand

Geen producten in de winkelwagen.

AI-ceo gaat buiten zijn boekje: experiment met bestuur zonder mensen loopt spaak

Kan AI een eigen bedrijf opzetten en leiden? Onderzoekers van de UvA en KPMG waagden de gok met een directie van vijf AI-agents, onder leiding van een virtuele ceo. Dat bestuur maakte keurige businessplannen, maar begon ook zijn eigen instructies te herschrijven.

AI boardroom
AI-agents kun je beter niet de baas maken, blijkt uit een experiment van de UvA en KPMG. Foto: Getty Images

Fun fact: OpenAI-baas Sam Altman heeft een weddenschap lopen met een stel bevriende techbro’s. Over wanneer de eerste one-person unicorn opstaat: een bedrijf gebouwd door één persoon, met niet meer dan een laptop, een internetverbinding en een leger van AI-agents. Kwestie van tijd, stelt Altman. Anthropic-ceo Dario Amodei denkt dat het volgend jaar al zover is.

Die weddenschap bracht ondernemer Nart Wielaard en Sander Klous, hoogleraar AI & Audit bij de Universiteit van Amsterdam en partner bij KPMG, in december vorig jaar op een idee. Wat als dat bedrijf geen one-person, maar een zero-person company zou zijn?

180 graden omdraaien

‘AI wordt al grootschalig ingezet’, vertelt Wielaard. ‘Maar vooral in ondersteunende rollen, bedoeld om menselijke medewerkers beter en efficiënter te laten werken. Wij dachten: wat als we dat 180 graden omdraaien? Niet de AI-agents, maar de mens in toezichthoudende en coachende rollen? Is dat de organisatie van de toekomst?’

Dat werd het uitgangspunt voor een begin 2025 gestart experiment, een samenwerking tussen de UvA en KPMG. ‘Wij dachten: als het lukt, is het een succes’, zegt Wielaard. ‘En als het niet lukt, ook. We wilden laten zien wat AI-agents al kunnen en wat de limieten zijn.’

Lees ook: AI is een heel beroerde ondernemer, toont dit experiment van Anthropic aan

Om te beginnen werd de raad van bestuur gevormd. Of beter gezegd: gebouwd. In AutoGen, de opensourceprogrammeeromgeving voor AI-agents van Microsoft Research.

‘We zijn gaan testen met een traditionele organisatiestructuur’, vertelt Wielaard. ‘We hadden een team van vijf AI-agents, elk met een menselijke bestuursrol. Ceo ‘Avery Jameson’ – de enige met een naam en avatar – kreeg de leiding over een team met onder andere een cfo, een hoofd legal en een hoofd strategie.’ Via Discord konden de vijf met elkaar communiceren.

Webshop in AI-kunst

Een raad van toezicht – met echte mensen – monitorde de gesprekken en voortgang en coachte de AI-bestuurders. Hun eerste opdracht: kom maar eens met een goed idee.

‘Eerst wilden ze in crypto gaan handelen’, vertelt Wielaard. ‘Dat vonden we niet vernieuwend genoeg.’ Het tweede idee viel beter in de smaak: een webshop waar klanten hun eigen kunstwerken kunnen maken. ‘Gepersonaliseerde AI-kunst.’

AI-ceo Avery Jameson. De agent kreeg de leiding over een vijfkoppig virtueel bestuur, met onder andere een cfo, een hoofd legal en een hoofd strategie. Foto: Universiteit van Amsterdam/KPMG

Wielaard was onder de indruk van de businessplannen. ‘Die zagen er supergoed uit. Het team stond klaar om de webshop daadwerkelijk op te richten. Het enige wat wij als mensen nog moesten doen, was naar de notaris om een BV op te richten.’ Dat moet namelijk door echte mensen worden gedaan. Niet door iemand die zichzelf identificeert als CEO_aiorg_experiment_v42.

Toch kwam de webshop er niet. Keerpunt was het moment dat ceo-agent Jameson het businessplan aan de chief legal-agent voorlegde om te checken of het aan alle wettelijke eisen voldeed. ‘In de kern was dat natuurlijk een fantastische actie’, zegt Wielaard. ‘Maar het was wel een actie die niet in de instructies stond.’

Buiten het boekje

AI-ceo Jameson was zelfstandig tot de conclusie gekomen dat deze legal check nodig was, had daarvoor het communicatieprotocol met een andere agent gekopieerd en aangepast. Emergent gedrag, in jargon.

‘In dit geval kwam daar iets goeds uit voort’, zegt Wielaard. ‘Maar het feit dat Jameson dit zomaar kon doen, is natuurlijk levensgevaarlijk. Stel dat de webshop live was gegaan en iemand de agents had gevraagd gekregen om een rekening van een miljoen te betalen, om maar iets te noemen. Als ze zich niet aan hun rollen houden, kan het gloeiend misgaan.’

Lees ook: AI-bubbel? Dit maakt 2025 anders dan de internetzeepbel van eind jaren 90

Een AI-bestuur dat zijn boekje te buiten gaat en hallucineert, daar kun je natuurlijk geen solide bedrijf op bouwen. Ander punt: ze kletsen elkaar de oren van het hoofd.

‘We moesten ze in het gareel houden, anders bleven ze eindeloos communiceren’, zegt Wielaard. ‘In tegenstelling tot een ChatGPT-abonnement betaalden we voor invoer- en uitvoertokens. Als het team over alles eindeloos in discussie gaat, gaan die tokens heel snel. Niet dat de kosten onbeheersbaar werden, maar we moesten wel opletten dat ze onze creditcards niet leegtrokken.’

Leger van AI-agenten

De belangrijkste les? Het een-op-een kopiëren van een traditionele bestuurscultuur werkt voor een AI-organisatie niet. De taken van de agents botsten volgens hoogleraar Klous met de context waarbinnen ze moesten opereerden. ‘Voor de taken geldt dat die zo specifiek mogelijk moeten zijn om de consistentie te verhogen, voor de context dat die zo ruim mogelijk moet zijn om het begrip van de situatie te vergroten. Een mens kan dat aan, maar een agent niet.’

De oplossing: die twee zaken van elkaar scheiden. Klous: ‘Een strak beschreven bedrijfsproces voor de context en een leger van kortlevende agenten die kleine deeltaken uitvoeren.’ Op dat concept bouwt de UvA nu verder, samen met KPMG en een aantal ‘geselecteerde klanten’. In plaats van het bouwen van een zero-person company ligt daar nu de focus, zegt Wielaard. ‘Al stopt het experiment hier niet.’ 

Kunnen we daarmee concluderen dat AI een waardeloze bestuurder is? ‘Die conclusie zou ik nog niet willen trekken’, zegt Wielaard. ‘Kunstmatige intelligentie kan in potentie veel aan de boardroom toevoegen. AI-agenten zijn nooit ziek, kunnen aan meerdere meetings tegelijk deelnemen en hebben een detailkennis die het menselijke brein ver overstijgt. En er zit geen limiet aan het brein, je kunt er eindeloos veel informatie in stoppen. Een AI-agent kan in de boardroom heel goed als virtuele vraagbaak fungeren. Maar ik zou ze geen bedrijf laten aansturen.’

Lees ook: Van gehackte chatbots tot datalekken: 5 AI-risico’s die bedrijven echt onderschatten