Super Mario laten besturen door een intelligente computer wordt veel makkelijker als die computer een beetje nieuwsgierig is. Onderzoekers van de University of California, Berkeley vonden een manier om AI experimenteer-zin te geven.

Wat Mario doet in de filmpjes lijkt misschien niet zo indrukwekkend. Hij springt wat, beweegt zo goed hij kan naar rechts op het scherm, en dat is het dan. Achter zijn bewegingen zit echter geen mens, die begrijpt wat er op het scherm gebeurt en dus weet waar hij heen moet. Het is een kunstmatige intelligentie, die volgens zijn ontwerpers een soort nieuwsgierigheid heeft meegekregen en daardoor spelletjes kan spelen waar eerdere AI's niet uitkwamen.

 

 

Beloning

De onderzoekers denken dat nieuwsgierigheid belangrijk is om kunstmatige intelligentie echt nuttig te kunnen maken. Nu leren veel AI-programma's namelijk aan de hand van een externe beloning. Het 'leerproces' is simpelweg dingen proberen totdat de beloning zo groot mogelijk is. Dat is volgens de Berkeley-informatici onrealistisch; mensen hebben ook niet voor al hun acties een beloning in het achterhoofd. We vertonen allerlei gedrag waar we niet per sé iets mee winnen; de onderzoekers beschrijven dat als nieuwsgierigheid.

Het was niet makkelijk om zo'n menselijke eigenschap in een intelligent programma te bouwen. Mario, of het programma dat hem bestuurde, moest objecten op het scherm herkennen. Wist hij eenmaal of iets bijvoorbeeld een muurtje was of een vijand, dan kon hij bepalen wat er moest gebeuren. In die bepaling verschilt hij echter van andere AI's: in plaats van de 'optimale strategie' koos de computer een min of meer willekeurige actie. Op die manier deed Mario onverwachte dingen. Als hetgene dat moest gebeuren (Mario moest bijvoorbeeld over een muurtje springen) eenmaal lukte, identificeerde de computer het volgende opstakel en experimenteerde weer net zo lang tot hij daar langs kwam.

Na een beetje training bleek de nieuwsgierigheid zijn vruchten af te werpen. Mario verkende in relatief korte tijd een groot deel van het eerste level van het spel. Het tweede level, waarin Mario ondergronds gaat, kostte wat moeite. Maar na een paar aanpassingen lukte het om ook daar voortgang te maken.

Hoewel de bewegingen van Mario regelmatig klungelig overkomen, demonstreren de onderzoekers hier wel iets bijzonders. Een nieuwsgierige computer, die zelf op verkenning gaat. Niet omdat hij daar iets voor terugkrijgt, maar omdat hij het zelf 'wil'. Misschien is dit wel de eerste stap naar machines die écht net als als mensen kunnen denken.

 

Vond je dit een interessant artikel, abonneer je dan gratis op onze wekelijkse nieuwsbrief.