Nieuw AI-model scoort op het ‘niveau van een mens’ op intelligentietests
Share
Wordt 2025 het jaar waarin ‘algemene artificiële intelligentie’ even slim is als een mens? Mogelijk wel, want op tests die het ‘redeneervermogen’ van AI meten, scoort het nieuwe model van OpenAI op “menselijk niveau”. Dat heeft topman Sam Altman aangekondigd.
Maar het nieuwe O3-model van OpenAI zou anders zijn en zou kunnen doorgaan voor een AGI, ofte Artificial General Intelligence. Dat is een AI-model dat verschillende taken aankan, autonoom leert en kan redeneren op het niveau van een mens.
Om te meten hoe ‘menselijk slim’ een AI-model is, wordt het onderworpen aan de zogenaamde ARC-AGI-benchmark. Dat staat voor Abstract and Reasoning Corpus for Artificial General Intelligence. Eenvoudig gesteld: hoe hoger de score, hoe ‘meer menselijk’ het redeneervermogen van het AI-model is.
Tot nu scoorden de beste AI-modellen 55 procent op die test. O3 zou 85 procent halen, wat de score is van een gemiddelde mens. Voor wie het interesseert: de test omvat logica-puzzels en -vraagstukken die je wel vaker in IQ-tests vindt.
Echter: op dit moment moeten we Altman en OpenAI op hun woord geloven. Buiten een handjevol onderzoekers zag niemand O3 al in actie. Het model wordt momenteel getest op veiligheid. Wanneer het model beschikbaar zal zijn, is niet bekend.