AI-agenten bouwen C-compiler

Team van AI-agenten bouwt (bijna) zelfstandig (bijna) perfect werkende C-compiler

Onderzoekers van Anthropic hebben bij wijze van experiment zestien AI-agenten samen een functionele C-compiler laten bouwen, zonder uitgebreide menselijke supervisie.

Een team van zestien AI-agenten heeft zelfstandig een volledige C-compiler ontwikkeld die grote softwareprojecten aankan, waaronder de Linux-kernel. Het experiment moet aantonen waartoe autonome softwareontwikkeling met AI inmiddels in staat is, maar legt tegelijk duidelijke grenzen en risico’s bloot.

Werkende compiler

Het experiment werd uitgevoerd bij Anthropic, met AI-agenten die gebruik maken van Claude Opus 4.6. Meerdere instanties van het Claude kregen de opdracht om parallel aan hetzelfde softwareproject werken. De agenten kregen een opdracht en bleven autonoom doorwerken, zonder dat een mens hen voortdurend bijstuurde.

Bij wijze van geavanceerde demonstratie stresstest liet Anthropic agenten een C-compiler schrijven in Rust, volledig vanaf nul. Die compiler telt uiteindelijk ongeveer 100.000 regels code en kan Linux 6.9 compileren voor verschillende hardwareplatformen, waaronder x86, ARM en RISC-V.

Claude Opus 4.6 vindt 500 kwetsbaarheden in opensource software

Het volledige traject duurde twee weken, omvatte bijna 2.000 afzonderlijke AI-sessies en kostte ongeveer 20.000 dollar aan rekenkracht. Anthropic stelt dat een equivant team van menselijke programmeurs voor een gelijkaardige opdracht maanden de tijd zou nodig hebben.

Uitdaging

Volgens Anthropic lag de grootste uitdaging niet bij het schrijven van de code zelf, maar bij het ontwerpen van de omgeving rond de AI. Goede tests bleken cruciaal. Als tests onduidelijk of onvolledig waren, losten de agenten het verkeerde probleem op. Ook parallel werken vergde extra structuur, zodat agenten elkaar niet voortdurend tegenwerkten.

Het resultaat is functioneel, maar niet perfect. De compiler is geen volwaardige vervanger voor bestaande tools en levert minder efficiënte code af. Sommige onderdelen, zoals specifieke opstartlogica, vereisen nog steeds hulp van klassieke compilers.

Het experiment laat wel zien dat AI-systemen complexe taken autonoom kunnen uitvoeren. Dat opent volgens Anthropic nieuwe mogelijkheden voor softwareontwikkeling, zeker voor grote en langdurige projecten. Tegelijk is het experiment een waarschuwing voor al te blind vertrouwen. Software die niemand volledig heeft nagekeken, kan fouten bevatten die pas later aan het licht komen.

Autonome agent teams tonen volgens de Amerikaanse AI-specialist vooral waar de volgende stap ligt: niet sneller code schrijven, maar systemen bouwen die zichzelf gecontroleerd kunnen verbeteren.