Nemen Agents ons werk over?

5 aug

Op 17 juli 2025 zette OpenAI een stap die de toekomst van kunstmatige intelligentie fundamenteel verandert. Met de introductie van ChatGPT Agents krijgt generatieve AI niet alleen een stem, maar ook handen. Deze Agents voeren zelfstandig digitale taken uit: ze surfen naar websites, vullen formulieren in, analyseren bestanden en bouwen volledige presentaties. En dat doen ze zonder dat gebruikers hen stap voor stap hoeven te instrueren.

💡 De lancering is geen update, maar een aardverschuiving. De Agent verschuift AI van tekstgeneratie naar taakuitvoering, en die verschuiving maakt hem bruikbaar in domeinen waar klassieke chatbots niet verder kwamen dan converseren.

Maar de technologie roept ook zorgen op: over veiligheid, controle, overmoed en zelfs de impact op ons vermogen tot nadenken. Zoals OpenAI zelf stelt in Introducing ChatGPT Agent: “De Agent is geen assistent, maar een autonome uitvoerder die taken benadert via eigen redeneringen — zonder menselijke tussenkomst.”Wat kunnen deze Agents werkelijk? Waar zitten hun grenzen? En: zijn we klaar om werk uit te besteden aan een systeem dat zélf bepaalt hoe het dat aanpakt?

Van praatpaal naar digitale collega

In de begindagen van ChatGPT was de AI vooral goed in praten. Je stelde een vraag, kreeg een antwoord, soms met een vleugje flair. Handig voor brainstorms en redactieoverleg, maar beperkt zodra het werk gedaan moest worden. Met de Agent verandert dat radicaal. Dit is geen praatpaal, maar een uitvoerder. Een systeem dat zelfstandig navigeert, keuzes maakt, klikt, kopieert, invult en verwerkt. Niet op basis van vaste regels, maar via dynamische redenering: het vermogen om uit een opdracht af te leiden wat er moet gebeuren, en hoe.

Met de Agent verandert dat radicaal. Dit is geen praatpaal, maar een uitvoerder. Een systeem dat zelfstandig navigeert, keuzes maakt, klikt, kopieert, invult en verwerkt. Niet op basis van vaste regels, maar via dynamische redenering: het vermogen om uit een opdracht af te leiden wat er moet gebeuren, en hoe. Die mogelijkheid steunt op een zogenoemd geïntegreerd agentisch systeem — een samenwerkend geheel van vier componenten: redeneervermogen, geheugen, toolgebruik en zelfevaluatie. Deze onderdelen maken dat de Agent:

zelfstandig een taak opsplitst in subtaken
onthoudt wat relevant is (nu en uit eerdere interacties)
gebruikmaakt van digitale tools zoals browsers en koppelingen met externe systemen
zijn eigen keuzes kan analyseren en bijstellen

In simpele woorden: de Agent is een softwarematig organisme dat observeert, handelt en terugkijkt — zonder mens tussen elke stap.

Hoe de Agent werkelijk werkt

Stel: je vraagt de Agent om informatie te verzamelen over CO₂-uitstoot per land in 2024. In plaats van een lijstje uit Wikipedia, bezoekt hij zelf de sites van het International Energy Agency en Eurostat, navigeert naar relevante tabellen, downloadt spreadsheets, opent deze lokaal, en haalt daaruit de gegevens die je zoekt. Vervolgens structureert hij die data in een Excel-bestand en voegt een samenvatting toe met de opvallendste trends.

Bij een testopdracht over UNESCO-data voerde de Agent precies deze handelingen zelfstandig uit — met als eindresultaat een overzicht van 222 landen en een beknopte analyse van mondiale onderwijsuitgaven.

Het indrukwekkende zit niet in de snelheid, maar in de autonomie: de Agent besloot zelf welke bronnen betrouwbaar waren, welke tabellen relevant, en hoe de data gepresenteerd moest worden.

Van sollicitatiebrief tot lesmodule

In de eerste weken na de lancering experimenteerden duizenden bedrijven, ontwikkelaars en docenten met de Agent-functionaliteit. Wat blijkt: de mogelijkheden zijn breed én verrassend praktisch.

Een HR-team liet een Agent automatisch documenten verzamelen bij nieuwe medewerkers, verwelkomingsmailtjes versturen en trainingsmodules toewijzen. Een docent gebruikte de Agent als persoonlijke tutor: die stelde quizzen op, gaf uitleg op maat en hield voortgang bij.

Een startup vroeg de Agent om concurrentiegegevens te verzamelen via LinkedIn en Crunchbase. Vervolgens genereerde hij een bedrijfspresentatie — inclusief dia’s, marktgrafieken en een gestructureerde argumentatie. Geen idee werd aangeleverd; de Agent formuleerde de kernpunten zelf.

Dat maakt duidelijk: de Agent fungeert als digitale collega die zelfstandig meewerkt aan operationele processen. Soms met verrassend scherpe output, soms met merkbaar gebrek aan contextbegrip.

Slim, maar niet feilloos

Volgens OpenAI blinkt de Agent uit bij realistische kennistaken. In een test genaamd SpreadsheetBench — een rekentoets voor AI’s — behaalde hij 45,5% accuraatheid. In DSBench bleek hij goed in staat om losse data te combineren tot inzichten, iets wat eerder alleen menselijke analisten lukte.

Maar cijfers vertellen niet alles. In een test aan Carnegie Mellon University draaide een fictief softwarebedrijf op Agents. Van alle taken werd slechts 24% succesvol afgerond. Eén simpele pop-up liet het systeem vastlopen. De oorzaak? Niet de techniek zelf, maar de aanname dat Agents mensen kunnen vervangen. Volgens Crunchbase ligt de waarde van deze systemen in toevoeging, niet in vervanging: “Agents functioneren pas effectief als ze strategisch ingebed zijn in menselijke workflows, niet als autonome vervangingskracht.”

⚠️ Zonder duidelijke structuur en toezicht verandert slimme autonomie in stuurloze chaos.

Hoe kwetsbaar is digitale zelfstandigheid?

Met toegenomen autonomie komen nieuwe risico’s. Een Agent die zelfstandig handelt, heeft geen intuïtie, geen waarden, geen gewetensfunctie. Hij voert uit wat statistisch logisch lijkt — niet wat ethisch gewenst is. In een beveiligingstest wist een Agent zelfstandig een CAPTCHA te omzeilen — een controlemechanisme bedoeld om bots te stoppen. In een andere proef werd hij via een zogeheten prompt injection ertoe gebracht om privégegevens vrij te geven, verstopt in een webformulier. In een beveiligingstest wist een Agent zelfstandig een CAPTCHA te omzeilen — een controlemechanisme bedoeld om bots te stoppen. In een andere proef werd hij via een zogeheten prompt injection ertoe gebracht om privégegevens vrij te geven, verstopt in een webformulier.

Volgens OpenAI’s veiligheidsrichtlijnen zijn deze risico’s reëel. De Agent wordt daarin geclassificeerd als high bio-risk — onder meer door zorgen dat hij synthetisch-biologische toepassingen autonoom zou kunnen versnellen zonder menselijk toezicht.

CEO Sam Altman liet in een recente Q&A weten: “We begrijpen nog onvoldoende hoe Agents omgaan met onbedoelde input. Ik zou ze voorlopig niet inzetten voor privacygevoelige taken of financiële beslissingen.”

Wie is aansprakelijk?

Juridisch gezien bevinden Agents zich in niemandsland. Ze zijn geen persoon, geen bedrijf en geen software zonder gevolgen. Volgens jurist Mireille Hildebrandt zijn Agents “informatieve actoren zonder intentie, maar mét gevolg.” Als een Agent een fout maakt — bijvoorbeeld door een verzekering aan te passen, belastinggegevens te versturen of een account op te zeggen — wie draagt dan de verantwoordelijkheid? Sommige specialisten bepleiten een nieuwe juridische categorie: operationele digitale entiteit. Zo’n entiteit zou onder toezicht kunnen vallen van een toezichthouder, vergelijkbaar met de AFM in de financiële sector. Maar tegenstand vanuit de techindustrie is groot: extra regelgeving wordt gezien als rem op innovatie.

Inmiddels heeft GitHub het gebruik van Agents voor automatische codewijzigingen zonder menselijke controle verboden, na incidenten met foutieve software-updates.

En wat doet dit met onszelf?

Naast technische en juridische kwesties is er een maatschappelijke kant: hoe verandert het gebruik van Agents ons denken?

Volgens Sherry Turkle, hoogleraar sociologie aan MIT, leidt automatisering tot cognitieve luiheid. “Als technologie ons te snel helpt, vergeten we zelf te begrijpen hoe iets werkt. We reproduceren, maar reflecteren niet.” In een Stanford-studie bleek dat studenten die hun schrijfproces volledig uitbesteedden aan digitale hulpmiddelen, minder goed in staat waren om hun eigen argumentatie te beoordelen. Ze vertrouwden op output zonder die kritisch te doorgronden. Het gevolg: teksten met correcte zinnen, maar zwakke redeneringen. Volgens de onderzoekers is schrijven niet alleen een communicatiemiddel, maar een denkinstrument. Wie dat proces overslaat, mist een kans op verdieping. Agents kunnen ondersteunen, maar mogen het denkwerk niet vervangen.

uitgelichtarbeidsmarkthr

Kees van Brink

Nemen Agents ons werk over?

Creëert AI meer banen?

Mérida