Nieuw AI-model scoort op het ‘niveau van een mens’ op intelligentietests

Nieuw AI-model scoort op het ‘niveau van een mens’ op intelligentietests

Wordt 2025 het jaar waarin ‘algemene artificiële intelligentie’ even slim is als een mens? Mogelijk wel, want op tests die het ‘redeneervermogen’ van AI meten, scoort het nieuwe model van OpenAI op “menselijk niveau”. Dat heeft topman Sam Altman aangekondigd.

Op dit moment zijn AI-modellen heel gespecialiseerd. Chatbots zijn zeer goed in ‘conversaties’ voeren, andere modellen zijn pakweg heel goed in het herkennen van tumoren op radiografieën. Maar echt ‘intelligent’ zijn de bovenstaande AI’s niet echt. Chatbots voorspellen welke woorden het meest coherent en logisch achter mekaar horen te staan, zonder er betekenis aan te geven. De AI-radioloog speurt naar vlekken op dezelfde manier waarop wij ‘zoek de zeven verschillen’-zoekprenten oplossen. Het speurt naar patronen, maar geeft er geen betekenis aan.

Maar het nieuwe O3-model van OpenAI zou anders zijn en zou kunnen doorgaan voor een AGI, ofte Artificial General Intelligence. Dat is een AI-model dat verschillende taken aankan, autonoom leert en kan redeneren op het niveau van een mens.

Om te meten hoe ‘menselijk slim’ een AI-model is, wordt het onderworpen aan de zogenaamde ARC-AGI-benchmark. Dat staat voor Abstract and Reasoning Corpus for Artificial General Intelligence. Eenvoudig gesteld: hoe hoger de score, hoe ‘meer menselijk’ het redeneervermogen van het AI-model is.

Tot nu scoorden de beste AI-modellen 55 procent op die test. O3 zou 85 procent halen, wat de score is van een gemiddelde mens. Voor wie het interesseert: de test omvat logica-puzzels en -vraagstukken die je wel vaker in IQ-tests vindt.

Echter: op dit moment moeten we Altman en OpenAI op hun woord geloven. Buiten een handjevol onderzoekers zag niemand O3 al in actie. Het model wordt momenteel getest op veiligheid. Wanneer het model beschikbaar zal zijn, is niet bekend.

Terug naar blog