Begrippenlijst A- Z
Kunstmatige intelligentie (AI) is een veelbesproken onderwerp op dit moment, vooral vanwege de introductie van AI-writers zoals ChatGPT. Veel mensen zijn geïnteresseerd in de tools, maar er komt veel terminologie bij kijken die intimiderend kan zijn voor leken.
Om je op weg te helpen hebben we een verklarende woordenlijst opgesteld met een groot aantal acroniemen, afkortingen, technische termen en grote namen in de AI-wereld.
Raadpleeg onderstaande tabel voor een snelle definitie van de term waarin je geïnteresseerd bent en klik op de term om een uitgebreidere uitleg te lezen. In veel gevallen hebben we de Engelse term behouden, omdat het gebruikelijker is om Engelse terminologie te gebruiken voor AI-gerelateerde onderwerpen.
Begrippenlijst van AI-termen | Afkortingen & Terminologie
Algoritme
Een algoritme is een eindige reeks regels die een computersysteem volgt om een bepaalde taak uit te voeren. Het is een soort programma dat op een gegeven moment stopt en niet oneindig doorwerkt.
Een algoritme kan bijvoorbeeld een reeks wiskundige stappen zijn om een bepaalde variabele te berekenen. Ze kunnen ook worden ontworpen voor complexere taken, zoals beslissen welke content moet worden gepromoot op iemands for you page op sociale media.
Alignment
Alignment (afstemming) is de mate waarin de doelstellingen en prikkels/stimulansen van een AI-systeem overeenstemmen met de bedoelingen van de makers ervan. AI is “aligned” als de acties leiden tot de resultaten die de makers voor ogen hadden, en “misaligned” als de acties leiden tot andere ongewenste resultaten.
Alignment wordt steeds belangrijker naarmate de mogelijkheden van AI toenemen. Emergent gedrag (emergent behavior) kan zich voordoen, waardoor uitkomsten optreden die we niet kunnen voorspellen.
Dit wordt waarschijnlijker naarmate we ons meer richten op langetermijndoelstellingen zoals artificial general intelligence (AGI), aangezien de manier waarop AI-systemen werken steeds moeilijker te begrijpen wordt voor mensen. AI-veiligheidsonderzoek is sterk gericht op
AlphaGo
AlphaGo is een AI-programma dat is ontworpen om het populaire bordspel Go te spelen. Het spel staat bekend om zijn hoge mate van complexiteit, waardoor eerdere computersystemen moeite hadden om het goed te spelen.
AlphaGo wist in 2017 de beste Go-speler, Ke Jie, te verslaan, net zoals Deep Blue in 1997 Garry Kasparov wist te verslaan bij het schaken.
Antropomorfisme
Antropomorfisme is het toekennen van menselijke eigenschappen, motivaties, bedoelingen en emoties aan niet-menselijke entiteiten. Mensen hebben de neiging allerlei dingen te antropomorfiseren, van dieren tot het weer.
We antropomorfiseren ook steeds meer technologie, met name AI die menselijke intelligentie lijkt te vertonen.
Mensen hechten zich bijvoorbeeld vaak emotioneel aan chatbots of geloven dat een chatbot die hallucineert opzettelijk tegen hen liegt. Ze kunnen naar AI-systemen of robots verwijzen met geslachtsaanduidingen, waardoor ze menselijke eigenschappen krijgen die ze in feite niet bezitten.
Artificial general intelligence (AGI)
Artificial general intelligence (AGI) of kunstmatige algemene intelligentie (KAI) verwijst naar een hypothetisch toekomstig AI-systeem waarvan de intelligentie die van de mens voor alle intellectuele taken evenaart of overtreft.
Veel AI-onderzoekers geloven dat AI dit punt waarschijnlijk zal bereiken en de menselijke intelligentie ergens deze eeuw zal overtreffen als gevolg van de versnelling van machine learning.
Dit scenario wordt vaak besproken in de context van alignment en AI-veiligheid: als AI intelligenter wordt dan mensen, is het essentieel dat het blijft werken aan onze doelen en geen mensen in gevaar brengt.
Artificial intelligence (AI)
Artificial intelligence (AI) of kunstmatige intelligentie (KI) is menselijke of dierlijke intelligentie die door machines wordt vertoond. Een voorbeeld hiervan is het vermogen om de wereld op dezelfde manier als mensen waar te nemen, te begrijpen en te beredeneren.
In de praktijk wordt AI gebruikt voor een breed scala aan toepassingen. AI-technologie wordt gebruikt in chatbots op basis van natuurlijke taalverwerking (natural language processing, NLP), in autonome (zelfrijdende) voertuigen, in zoekmachines en in bots die spelletjes spelen, zoals AlphaGo en Deep Blue.
AI-detector
Een AI-detector is een hulpmiddel dat is ontworpen om te detecteren wanneer een stuk tekst (of soms een afbeelding of video) is gemaakt door AI-tools (zoals ChatGPT en DALL-E). Deze detectoren zijn niet 100% betrouwbaar, maar ze kunnen een indicatie geven van de waarschijnlijkheid dat een tekst door AI is gegenereerd.
AI-detectoren werken met soortgelijke grote taalmodellen (large language models, LLMs) als de tools die ze proberen te detecteren. Deze modellen kijken in wezen naar een tekst (of afbeelding of video) en vragen zich af: “Is dit iets wat ik zou hebben gegenereerd?”. Ze zoeken naar lage niveaus van twee criteria: perplexiteit (perplexity) en onregelmatigheid (burstiness).
AI-detectoren kunnen worden gebruikt door universiteiten en andere instellingen om door AI gegenereerde inhoud te identificeren.
AI-veiligheid
AI-veiligheid (ook wel AI safety genoemd) is een onderzoeksgebied dat zich bezighoudt met de vraag hoe AI op een veilige en ethische manier kan worden ontwikkeld en gebruikt. Onderwerpen die door AI-veiligheidsonderzoekers worden besproken zijn onder meer afstemming (alignment), vooringenomenheid (bias), de effecten van automatisering, hallucinatie en het gebruik van generatieve AI om deepfakes en verkeerde informatie te genereren.
AI-writing
AI-writing of AI-schrijven is een algemene term voor het gebruik van AI (meestal LLMs) om tekst te genereren of aan te passen. Het omvat chatbots zoals ChatGPT, maar ook parafraseerstools en grammaticacheckers, zoals die van QuillBot en Scribbr.
Automatisering
Automatisering houdt in dat een proces of systeem automatisch en onafhankelijk werkt, zonder menselijke inbreng. Automatisering kan de hoeveelheid menselijke arbeid in een proces verminderen of bepaalde soorten menselijke arbeid volledig overbodig maken.
Sinds de industriële revolutie zijn steeds meer soorten werk geautomatiseerd. Dit heeft geleid tot een enorme toename van de efficiëntie, maar ook tot ontwrichting van de betrokken beroepen, wat tot werkloosheid kan leiden.
AI-hulpmiddelen kunnen worden gezien als een manier om het schrijfproces te automatiseren. Ze zullen mogelijk leiden tot een ontwrichting van bepaalde gebieden, zoals onderwijs en administratief werk.
Autonoom
Het bijvoeglijk naamwoordautonoombetekent “werken zonder controle van buitenaf”. In de wereld vanAIwordt het vaak gebruikt om te verwijzen naar systemen,robots, software, etc. die zelfstandig kunnen werken, zonder directe menselijke input.
Bard
Bard is een door Google ontwikkelde chatbot die op 21 maart 2023 is uitgebracht. Net als ChatGPT en Bing Chat is de tool gebaseerd op LLM-technologie.
Sinds de lancering heeft Bard echter gemengde reacties ontvangen. Gebruikers beweren dat het minder krachtig is dan ChatGPT bij vergelijkbare prompts.
Bias
In de context van AI verwijst bias of vooringenomenheid naar de aannames die een AI-systeem doet om het leerproces en de taakuitvoer te vereenvoudigen. AI-onderzoekers proberen bias tot een minimum te beperken, omdat deze kan leiden tot slechte resultaten of onverwachte uitkomsten.
Bias kan ook verwijzen naar de neiging van AI-systemen om vooroordelen zoals seksisme, racisme of verschillende soorten onderzoeksbias te reproduceren. Dit is een punt van zorg dat door AI-veiligheidsonderzoekers aan de orde wordt gesteld.
Big data
Big data verwijst naar datasets die zo groot of complex zijn dat normale dataverwerkingssoftware ze niet kunnen verwerken. Dit is de sleutel tot de kracht van technologieën zoals LLMs, waarvan de trainingsdata bestaan uit enorme hoeveelheden tekst.
Bing Chat
Bing Chat (ook Bing AI genoemd) is een door Microsoft ontwikkelde chatbot die sinds 7 februari 2023 wordt geïntegreerd in hun zoekmachine Bing. De chatbot werd ontwikkeld in samenwerking met OpenAI op basis van hun GPT-4-technologie.
Bij de lancering zorgde Bing Chat voor enige controverse vanwege zijn neiging om te hallucineren en ongepaste antwoorden te geven. Velen op het gebied van AI-veiligheid leverden kritiek op de slechte alignment voorafgaand aan de release.
Anderen waren enthousiast over de mogelijkheid om GPT-technologie in een zoekmachine te integreren, aangezien ChatGPT (destijds) het internet niet kon doorzoeken.
Burstiness
Burstiness of onregelmatigheid is een maat voor de variatie in zinsbouw en -lengte. AI-teksten vertonen doorgaans een lage mate van burstiness, terwijl menselijke teksten doorgaans een hogere burstiness vertonen.
Een AI-detector combineert burstiness en perplexity (perplexiteit) meestal om te bepalen of een tekst door AI gegenereerd is. Een hogere temperatuurinstelling in een LLM resulteert in tekst met een hogere perplexity en burstiness.
CAPTCHA
Een CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) is een test die vaak online wordt gebruikt om te controleren of de gebruiker menselijk is. Ze worden bijvoorbeeld gebruikt om te voorkomen dat spambots sites overspoelen met spamcomments.
Om een CAPTCHA te voltooien, moet de gebruiker eenvoudige taken uitvoeren, zoals het intypen van wat tekst van een vervormde afbeelding of het klikken op afbeeldingen die een bepaald object bevatten.
Ze zijn ontworpen om eenvoudig te zijn voor mensen, maar moeilijk op te lossen voor computersystemen. Toch zijn sommigen erin geslaagd ze automatisch op te lossen met behulp van machine learning.
Chatbot
Een chatbot is een softwaretoepassing die een menselijk gesprek simuleert, meestal in de vorm van een schriftelijke chat. Ze zijn gebaseerd op deep learning en NLP-technologie en kunnen worden gebruikt voor taken als klantenondersteuning en het schrijven van content.
Op LLM gebaseerde chatbots zijn in populariteit toegenomen sinds de release van ChatGPT, Bing Chat en Bard in de afgelopen maanden. Minder geavanceerde chatbots bestonden al langer. Zo werd een van de eerste chatbots, ELIZA, uitgebracht in de jaren ’60.
ChatGPT
ChatGPT is een door OpenAI ontwikkelde chatbot die werd uitgebracht op 30 november 2022. De tool is gebaseerd op LLM-technologie en verfijnd met RLHF.
ChatGPT is een enorm succes en is naar verluidt de snelst groeiende applicatie aller tijden geworden. De tool wordt gezien als een grote stap voorwaarts in AI-technologie en heeft het onderwerp AI-writing onder de aandacht van het publiek gebracht.
OpenAI heeft ook kritiek gekregen van AI-veiligheidsonderzoekers, die stellen dat de tool niet goed is afgestemd (aligned) en het risico op verspreiding van desinformatie met zich meebrengt. Sommigen beweren ook dat het bedrijf niet in lijn met zijn waarden heeft gehandeld, aangezien OpenAI de technische gegevens van de modellen niet openbaar heeft gemaakt.
Computer
Een computer is een soort machine die geprogrammeerd is om verschillende taken automatisch uit te voeren. De term kan verwijzen naar een grote verscheidenheid aan apparaten, waaronder pc’s, smartphones, spelconsoles, rekenmachines en supercomputers.
Charles Babbage wordt meestal aangehaald als de “vader van de computer”. Hij vond de eerste mechanische computers uit aan het begin van de 19e eeuw. Sinds halverwege de 20e eeuw zijn computers steeds meer verspreid en toegankelijk geworden voor het grote publiek.
Computers of supercomputers zijn essentieel voor de ontwikkeling van AI-systemen.
DALL-E
DALL-E is een AI-beeldgenerator die op 5 januari 2021 door OpenAI werd uitgebracht. Een tweede versie, DALL-E 2, begon uit te rollen op 20 juli 2022. De naam is een portmanteau (vlechtwoord) van de namen van het Pixar-personage WALL-E en de kunstenaar Salvador Dalí.
Beide versies worden aangedreven door een versie van GPT-3 die is aangepast om beelden te genereren in plaats van tekst. Ze hebben dus dezelfde technologische bouwstenen als ChatGPT, ondanks de zeer verschillende output.
Net als bij andere AI-beeldgeneratoren (e.g., Midjourney) is er veel discussie geweest over hoe DALL-E de toekomst van de kunst kan beïnvloeden, waarbij sommige tegenstanders beweren dat deze tools bestaande beelden plagiëren en kunnen worden gebruikt om deepfakes te maken.
Data scientist
De gebruikersrol die gericht is op het verzamelen en analyseren van data om bedrijfsgerelateerde problemen op te lossen met behulp van datagedreven technieken. Datawetenschappers vertalen vereisten in specifieke hypothesen en halen nuttige informatie uit gegevens om oplossingen te bieden voor zakelijke vereisten.
Deep Blue
Deep Blue was een AI-systeem ontworpen om te schaken. Het versloeg in 1997 de wereldkampioen Garry Kasparov en werd daarmee het eerste computersysteem dat de menselijke vaardigheid in schaken overtrof.
Dit werd gezien als een mijlpaal in de ontwikkeling van AI, omdat het aantoonde dat het systeem de complexe strategieën van het schaakspel beheerste. Jaren later zou een systeem met de naam AlphaGo dezelfde prestatie leveren in het bordspel Go.
Deepfake
Een deepfake is een stukje media dat door deep learning of andere AI-technologie is gemaakt om de werkelijkheid verkeerd voor te stellen, bijvoorbeeld door te laten zien dat iemand iets doet of zegt wat diegene niet heeft gedaan of gezegd. Deepfakes kunnen afbeeldingen, video of audio zijn. Momenteel kun je vaak herkennen dat ze nep zijn, maar ze worden steeds overtuigender.
Deepfakes zijn een belangrijk punt van zorg voor AI-veiligheidsdeskundigen, omdat ze kunnen worden gebruikt om desinformatie en nepnieuws te verspreiden, om seksueel expliciete beelden van mensen te genereren zonder hun toestemming, of om fraude te faciliteren.
Socialemediaplatforms, overheden en andere instellingen stellen vaak regels op tegen deepfakes, maar die zijn moeilijk te handhaven als ze niet op betrouwbare wijze kunnen worden gedetecteerd. Sommige AI-detectoren zijn ontworpen om deepfakes op te sporen, hoewel ze naar verluidt nog niet erg betrouwbaar zijn.
Deep learning
Deep learning is een vorm van machine learning. Deep learning-modellen zijn gebaseerd op neurale netwerken.
Ze bestaan uit een reeks lagen die onbewerkte data (raw data, zoals pixels) geleidelijk omzetten in een abstractere vorm (zoals een afbeelding van een gezicht), waardoor het model ze op een hoger niveau kan begrijpen.
ELIZA
ELIZA was een van de eerste chatbots die in de jaren zestig werd ontwikkeld door MIT-computerwetenschapper Joseph Weizenbaum. ELIZA speelde een psychotherapeut, waarbij de gebruiker optrad als de patiënt.
De programmering was vrij eenvoudig en ELIZA herhaalde meestal simpelweg de input van de gebruiker in de vorm van een vraag. Toch bleek het verrassend realistisch voor gebruikers, die er vaak van overtuigd raakten dat ELIZA hen kon begrijpen. Dit is een voorbeeld van een antropomorfisme.
Emergent behavior
Emergent behavior of emergent gedrag verwijst naar onverwachte vaardigheden of acties van AI-systemen. Dit zijn dingen waarvoor zij niet expliciet zijn opgeleid, maar die uit hun opleiding zijn voortgekomen. Complexe gedragingen ontstaan uit de interactie van een groot aantal eenvoudige elementen.
Zo werken LLMs op een basisniveau door te raden welk token (woord) als volgende in een zin komt. Ondanks dit vrij eenvoudige mechanisme zijn ze in staat om samenhangende, intelligent lijkende antwoorden te geven op een groot aantal vragen.
Andere gedragingen kunnen negatiever zijn, zoals de neiging van LLMs om te hallucineren of ongepaste antwoorden te geven. Veel AI-onderzoek berust op het invoeren van big data in een model en kijken wat er gebeurt, wat gepaard gaat met veel vallen en opstaan en onvoorspelbare resultaten.
Generative AI
Generative AI verwijst naar AI-systemen die tekst, afbeeldingen, video, audio of andere media genereren als reactie op prompts van de gebruiker. Hieronder vallen chatbots zoals ChatGPT, beeldgeneratoren zoals Midjourney, videogeneratoren, muziekgeneratoren, et cetera.
Generative pre-trained transformer (GPT)
Een generative pre-trained transformer (GPT) is een soort large language model (LLM) dat wordt gebruikt voor generatieve AI-toepassingen. GPT-modellen zijn neurale netwerken gebaseerd op een soort deep learning-model dat een transformator wordt genoemd. Het is momenteel de populairste vorm van LLM.
Het AI-bedrijf OpenAI heeft een aantal GPT-modellen uitgebracht: GPT-1 in 2018, GPT-2 in 2019, GPT-3 in 2020, GPT-3.5 in 2022 en GPT-4 in 2023. GPT-3.5 en GPT-4 worden gebruikt om ChatGPT aan te drijven, terwijl DALL-E draait op GPT-3.
Hallucinatie
In de context van AI verwijst hallucinatie naar het verschijnsel dat een AI-model vol vertrouwen reageert op een manier die niet wordt gerechtvaardigd door de trainingsdata. Dit betekent dat het model op dat moment een antwoord verzint. ChatGPT kan bijvoorbeeld een zelfverzekerd antwoord geven dat volledig fout is als iemand een vraag stelt waarop het model het antwoord niet weet
Hallucinatie is een emergent behavior en het gedrag is waargenomen in verschillende LLM-aangedreven chatbots. Het lijkt het gevolg te zijn van het feit dat deze modellen slechts waarschijnlijke antwoorden voorspellen en deze niet kunnen toetsen aan betrouwbare bronnen. Aangezien ze worden aangemoedigd om nuttige antwoorden te geven, proberen ze dat ook te doen als ze de gevraagde informatie niet hebben.
Hallucinatie is een probleem dat wordt besproken door AI-veiligheidsonderzoekers, die vrezen dat AI-systemen onbedoeld verkeerde informatie kunnen verspreiden.
Large language model (LLM)
Een large language model (LLM) of groot taalmodel is een neuraal netwerk met een groot aantal (meestal miljarden) parameters, waarbij grote hoeveelheden tekst worden gebruikt als trainingsdata. Het is momenteel een zeer populaire benadering van onderzoek naar natural language processing (NLP).
LLM’s worden eerder getraind voor algemene doeleinden dan voor specifieke taken. Ze blijken goed te functioneren vanwege de grote hoeveelheden data die bij hun training worden gebruikt, vertonen diverse emergent behaviors en kunnen zeer geavanceerde reacties produceren.
Het populairste type LLM op dit moment is de generative pre-trained transformer (GPT), die wordt gebruikt voor de populaire chatbot ChatGPT.
Machine learning (ML)
Machine learning (ML) is een onderzoeksgebied dat zich richt op de vraag hoe machines kunnen “leren” (d.w.z. steeds geavanceerdere taken kunnen uitvoeren). Het gaat om het gebruik van algoritmen die in interactie met trainingsdata geheel autonome beslissingen en voorspellingen maken.
Een momenteel populaire benadering van ML is deep learning, waarbij neurale netwerken worden gebruikt die uit meerdere lagen bestaan.
Machine translation
Machine translation of machinevertaling is het gebruik van software om tekst of spraak tussen talen te vertalen. Deze apps, zoals Google Translate en DeepL, maken meestal gebruik van neurale netwerken.
Op een basisniveau kan dit proces bestaan uit het vervangen van een woord in de ene taal door zijn equivalent in een andere taal. Maar voor betere resultaten moeten automatische vertaalsystemen rekening houden met de zinsbouw van de twee talen en de context waarin elk woord voorkomt, zodat ze tot de meest waarschijnlijke vertaling kunnen komen.
Midjourney
Midjourney is een generative AI-systeem dat beelden produceert als reactie op prompts van de gebruiker. Het is ontwikkeld en uitgebracht door het in San Francisco gevestigde bedrijf Midjourney, Inc. Het is momenteel in open bèta.
Net als DALL-E en andere AI-beeldgeneratoren is Midjourney het onderwerp geweest van zowel lof als kritiek, waarbij sommigen beweren dat de app kan worden gebruikt om deepfakes te maken of dat het het werk van menselijke kunstenaars plagieert, terwijl anderen de creatieve mogelijkheden en de toegankelijkheid van de tool benadrukken.
Model
Dit is een programma dat is getraind om patronen in data te herkennen. Je kunt een model hebben dat het weer voorspelt, talen vertaalt, afbeeldingen van katten herkent, enzovoort. Net zoals een modelvliegtuig een kleinere, eenvoudigere versie van een echt vliegtuig is, is een AI-model een mathematische versie van een proces uit de praktijk.
Natural language processing (NLP)
Natural language processing (NLP) of natuurlijke taalverwerking is het onderzoek naar hoe AI-systemen kunnen worden gebruikt om menselijke taal te verwerken en te genereren.
Momenteel ligt de nadruk op neurale netwerken en large language models (LLM’s), die een groot potentieel hebben om vloeiende tekst te genereren in antwoord op prompts van de gebruiker (zoals bij ChatGPT het geval is).
Neuraal netwerk
Een neuraal netwerk is een computersysteem dat is gebaseerd op de structuren van menselijke en dierlijke hersenen. Ze worden kunstmatige neurale netwerken (artificial neural networks, ANNs) genoemd om ze te onderscheiden van de biologische neurale netwerken waaruit de hersenen bestaan.
Een neuraal netwerk bestaat uit een verzameling kunstmatige “neuronen” (gebaseerd op de neuronen in biologische hersenen) die signalen zenden en ontvangen naar andere neuronen in het netwerk. Door deze structuur kan het netwerk geleidelijk leren om taken nauwkeuriger uit te voeren.
Neurale netwerken zijn essentieel voor large language models (LLMs) en andere manieren van deep learning.
OpenAI
OpenAI is een groot AI-onderzoeks- en ontwikkelingsbedrijf. Het heeft populaire tools uitgebracht, waaronder ChatGPT en DALL-E, en het ontwikkelde de generative pre-trained transformer-technologie achter deze tools.
Het bedrijf werd in 2015 opgericht door Ilya Sutskever, Greg Brockman, Sam Altman en Elon Musk (die niet langer betrokken is). De huidige CEO is Sam Altman. OpenAI begon als een non-profit, maar ging in 2019 over naar for-profit.
Parameter
Een parameteris een variabele binnen een AI-systeem die wordt gebruikt om voorspellingen te doen. Hoe geavanceerder hetLLM, des te meer parameters het model bevat. Er wordt aangenomen dat GPT-4 enkele honderden miljarden parameters bevat.
Perplexity
Perplexity of perplexiteit is een maat voor hoe onvoorspelbaar een tekst is. Een tekst met een hoge perplexity leest eerder onnatuurlijk of onzinnig dan een tekst met een lage perplexity. AI-writers produceren doorgaans teksten met een relatief lage perplexity, omdat de kans dan groter is dat ze zinvol zijn.
Daarom wordt perplexity in combinatie met burstiness gebruikt als een manier voor AI-detectors om AI-teksten van menselijke teksten te onderscheiden. AI-writers kunnen een temperatuurinstelling hebben waarmee de gebruiker tekst met een hogere perplexity kan produceren.
Phyton
Een van de veelgebruikte open-source programmeertalen voor Big Data- en AI-projecten. Gepopulariseerd door Google, wordt Python beschouwd als een beginnersvriendelijke taal, zeer flexibel door het gebruik van bibliotheken en efficiënt voor het verwerken van grote datasets. Python is populair vanwege zijn gemak bij het werken met grote datasets en de eenvoud bij het uitvoeren van analysetoepassingen.
Programmeren
Programmeren is het geven van instructies aan eencomputerin de vorm van programma’s die bestaan uit computercode. Deze code kan zijn opgesteld in verschillende programmeertalen, zoals C++ of Python. Computerprogramma’s maken vaak gebruik vanalgoritmen.
Prompt
Een prompt is de (tekstuele) input van de gebruiker waarop eengeneratief AI-model (zoals ChatGPT) reageert. De ontwikkeling van duidelijke prompts die nuttige resultaten opleveren en ongewenste uitkomsten vermijden wordt prompt engineering genoemd.
Reinforcement learning from human feedback (RLHF)
Reinforcement learning from human feedback (RLHF) is een methode voor machine learning (ML) die wordt gebruikt bij de ontwikkeling vanlarge language models(LLM’s).
Er wordt gebruikgemaakt van menselijke feedback om een “beloningsmodel” op te stellen dat vervolgens automatisch de reacties van het systeem optimaliseert. Het werd gebruikt bij de ontwikkeling van ChatGPT om de reacties van het model te verfijnen voordat het werd uitgebracht.
Robot
Een robot is een machine die automatisch (soms autonoom) handelingen kan verrichten. Robots bevatten meestal computersystemen die zijn geprogrammeerd om hun taken te kunnen uitvoeren. Onderzoek naar en de ontwikkeling van robots wordt robotica genoemd.
Robots worden vaak gebruikt in een industriële context, zoals in fabrieken, om repetitieve werkzaamheden te verrichten (waardoor taken die vroeger door mensen werden gedaan kunnen worden geautomatiseerd).
Robotics
Een technische discipline die zich bezighoudt met het bedenken en ontwerpen, bouwen, bedienen en toepassen van robots. Het doel van robotica is om machines te maken die mensen op verschillende manieren kunnen helpen en versterken, met of zonder de extra verbetering van AI.
Supervised learning & Unsupervised learning
Supervised learning is het proces waarin een model leert van voorbeelden. Het is vergelijkbaar met een scenario van een docent en een student: de docent stelt de student (het model) vragen en geeft de juiste antwoorden. De student bestudeert deze informatie en leert na verloop van tijd zelf vergelijkbare vragen te beantwoorden (en het juiste antwoord te geven). Het is bijzonder nuttig om systemen te trainen die afbeeldingen herkennen, talen vertalen of het juiste resultaat voorspellen.
Met unsupervised learning zoekt AI verborgen patronen in je data zonder enige begeleiding. Hierbij verkent de computer zelf data om interessante dingen te ontdekken. Stel dat je een zak vol puzzelstukken hebt, maar niet de doos met de afbeelding, zodat je niet weet wat je moet maken. Bij unsupervised learning wordt in feite onderzocht welke puzzelstukjes bij elkaar passen door overeenkomsten of groepen te zoeken, zonder te weten hoe het eindresultaat eruitziet.
Temperatuur
Temperatuur is een parameter in LLMs, zoals GPT-4. Meestal wordt de optie gegeven om een waarde tussen 0 en 1 te kiezen, waarmee je mate van willekeur in de output bepaalt.
- Bij een relatief lage temperatuur zal het model waarschijnlijk voorspelbare, maar samenhangende, tekst produceren en zeer vergelijkbare antwoorden geven als je je vraag herhaalt.
- Bij een hogere temperatuur heeft het model de neiging tekst te produceren die minder voorspelbaar is en mogelijk meer fouten bevat. Bij zeer hoge temperaturen produceert een LLM vaak onzin.
Voor hulpmiddelen als ChatGPT staat de temperatuurinstelling meestal standaard rond de 0,7: hoog genoeg om onvoorspelbare antwoorden te geven, maar laag genoeg om geen onzin te genereren.
Trainingsdata
De trainingsdata van een AI-systeem zijn de data (e.g., tekst, afbeeldingen) die zijn gebruikt om het systeem te trainen. Bij machine learning (ML) wordt het systeem gewoonlijk getraind op een grote hoeveelheid gegevens om patronen te herkennen en te leren om gewenste reacties te produceren.
Gesprekken met gebruikers in tools als ChatGPT kunnen worden gebruikt als trainingsdata voor toekomstige modellen.
Token
Een token is de basiseenheid van tekst die door een large language model (LLM) wordt verwerkt. Vaak is het een volledig woord, maar het kan ook een deel van een woord zijn, of een leesteken.
LLMs produceren tekst door herhaaldelijk te voorspellen welk token als volgende moet komen op basis van patronen die ze op basis van de trainingsdata hebben geleerd. Het is bijvoorbeeld zeer waarschijnlijk dat het volgende token na de tekst “Ik kon afgelopen niet in slaap komen afgelopen …” het woord “nacht” is.
LLMs kiezen echter niet altijd het token met de hoogste waarschijnlijkheid, omdat dit een hele repetitieve tekst zou opleveren die niet menselijk lijkt. In plaats daarvan hebben ze een temperatuurinstelling die beïnvloedt hoe waarschijnlijk het is dat ze bijvoorbeeld in elk geval het derde meest waarschijnlijke token kiezen. Daarom kunnen AI-writers verschillende antwoorden geven op één enkele vraag.
Turing-test
De Turing-test (ook wel imitation game genoemd) is een test die is uitgevonden door de computerwetenschapper Alan Turing in 1950. Hij is ontworpen om te testen of een machine in staat is om ogenschijnlijk menselijke intelligentie te vertonen.
De test omvat een menselijke beoordelaar die tekstuele gesprekken voert met een machine en een mens, zonder te weten wie wie is. De beoordelaar moet proberen vast te stellen wie een machine is en wie een mens. Als geen betrouwbaar onderscheid kan worden gemaakt tussen de twee, is de machine geslaagd voor de test.
Het “slagen voor de Turing-test” is onder liefhebbers van AI een norm geworden waaraan AI-systemen zouden moeten voldoen, maar AI-onderzoekers aanvaarden de test zelf niet als een betrouwbare, wetenschappelijke maatstaf voor intelligentie. Ook wordt de test bekritiseerd in andere gedachte-experimenten, zoals de Chinese kamer.