Go bordspel

Het computerprogramma AlphaGo heeft de eerste partij tegen wereldtopper Lee SeDol gewonnen.

Dit artikel werd oorspronkelijk gepubliceerd op 9 maart 2016.

De Chinese Go-professional Guo Juan raakt geëmotioneerd wanneer ze als analiste het publiek moet vertellen dat computerprogramma AlphaGo zojuist de beste menselijke speler van de afgelopen tien jaar heeft verslagen, de Zuid-Koreaan Lee SeDol. 'He is human. He has emotions. He can make mistakes', zegt de in Nederland wonende speelster bedroefd.

Voor de Go-wereld is de match tussen AlphaGo en Lee SeDol de evenknie van de schaakmatch tussen Garry Kasparov en IBM-supercomputer Deep Blue (In 1996 won Kasparov; in 1997 won Deep Blue). In oktober 2015 had AlphaGo al met 5-0 gewonnen van de Europees kampioen Fan Hui, maar deze staat ‘slechts’ als nummer 370 op de wereldranglijst, terwijl Lee SeDol de huidige nummer 4 is. Tot vandaag wist niemand hoe sterk AlphaGo echt zou zijn in een partij tegen een wereldtopper.

Het vijftigkoppige publiek van go-liefhebbers heeft in het Europese Go Centrum in Amstelveen zo’n vier uur ademloos gekeken naar de eerste van een serie van vijf partijen tussen mens en machine. Het was al snel duidelijk: AlphaGo speelt op wereldniveau. Een paar uur lang ging de partij gelijk op, maar op een gegeven moment kantelde de strijd en gaf de 33-jarige Zuid-Koreaan zich gewonnen. En dat terwijl hij van te voren had gezegd dat hij verwachtte de match met 5-0 of anders toch wel 4-1 te winnen. 

Voor een winst met 4-1 zou Lee SeDol de resterende vier partijen allemaal moeten winnen en die kans is klein. De druk op hem neemt toe en onder druk maken mensen meer fouten. Daarvan heeft de computer geen last. De winnaar van de match krijgt trouwens 1 miljoen dollar. Als AlphaGo wint, geeft Google DeepMind, de bouwer van het computerprogramma, het geld aan een goed doel.

AlphaGo - SeDol

Het raadsel van de menselijke intelligentie

DeepMind werd in 2011 opgericht en in 2014 gekocht door Google voor naar schatting zeshonderd miljoen euro. Het doel van Google DeepMind is het oplossen van het raadsel menselijke intelligentie. Lukt het om het lerend vermogen van het menselijk brein in één enkel computeralgoritme te vatten? Met zo’n algoritme kan een computer of een robot dan, net als het menselijk brein, uiteenlopende taken leren: van het interpreteren van beelden en het begrijpen en spreken van taal tot het leren spelen van viool of voetbal.

Van alle bekende bordspelen is Go verreweg het lastigste voor de computer. Dat ligt aan de complexiteit van het spel. Go kent veel meer mogelijke stellingen op het bord dan er atomen in het universum zitten. Veel te veel voor een computer om het spel met brute rekenkracht alleen te lijf te gaan. In dit opzicht is go intuïtiever dan schaken. Zelfs topspelers zeggen soms over het waarom van een zet: ‘het voelt gewoon goed.’ Schaakcomputer Deep Blue kon in 1997 met brute rekenkracht winnen van Kasparov. Bij Go is deze aanpak niet genoeg. AlphaGo had een slimmere aanpak nodig en die heet Deep Learning. 

In plaats van dat wij mensen de computer programmeren, programmeert de computer zich als het ware zelf. De computer leert van voorbeelden op een manier die lijkt op het leren door het menselijk brein. Het idee is dat een netwerk van kunstmatige neuronen op de computer in lagen wordt verdeeld. Elke laag neemt een deel van de patroonherkenning voor zijn rekening: bijvoorbeeld de detectie van licht of donker, van randen, van complexere vormen tot ten slotte de herkenning van complete voorwerpen.

Neuronen netwerk

Leren van miljoenen zetten

Het ‘brein’ van AlphaGo bestaat uit een netwerk met tientallen lagen van neuronen die worden getraind met bestaande partijen. AlphaGo heeft in de afgelopen twee jaar geleerd van miljoenen zetten die zijn gespeeld door professionele Go-spelers. Ook leert de computer van het spelen van miljoenen malen tegen zichzelf. Het grote voordeel van de computer is dat hij van duizenden partijen per dag kan leren, terwijl een mens misschien van duizend partijen in een jaar kan leren. 

Het idee van neurale netwerken dateert al uit begin jaren vijftig, net na de uitvinding van de computer. Decennialang leverden neurale netwerken geen goede resultaten. Veel wetenschappers geloofden niet meer in deze aanpak. Pas in de afgelopen jaren vallen puzzelstukjes op hun plaats en leveren neurale netwerken, nu onder de naam Deep Learning, spectaculaire resultaten.

Het geheim zit in neurale netwerken die dieper en daarmee slimmer zijn geworden dan voorheen en ook in de beschikbaarheid van heel veel data (plaatjes, filmpjes, teksten, spraak of Go-partijen…). En die diepe netwerken zijn alleen maar uit te rekenen dankzij enorme rekenkracht. Zo gebruikt AlphaGo 1202 CPU’s en 176 GPU’s (de centrale en grafische processoren van een computer).

Uithangbord

Google kan Deep Learning gebruiken voor het herkennen van foto’s en video’s, bij het interpreteren van spraak, bij automatisch vertalingen, bij zoekopdrachten, in sociale netwerken en voor nog gerichtere advertentieverkoop. En natuurlijk om te zorgen dat de zelfrijdende Google-auto straks razendsnel leert van zijn ervaringen waar dan ook ter wereld. Maakt een auto in Tokyo een fout, dan zou idealiter geen enkele auto waar ook ter wereld daarna die fout meer mogen maken.

Deep Learning biedt ook veel mogelijkheden in de geneeskunde. De computer kan helpen om snel uit te zoeken welke van tienduizenden mogelijke moleculen de grootste kans hebben om als geneesmiddel tegen bijvoorbeeld kanker of Alzheimer te werken. En de computer kan de menselijke arts ondersteunen bij het stellen van betere diagnoses. Allemaal door te leren van heel veel data. 

‘Een mens met papier, potlood en een rubberen band, die zichzelf een ijzeren discipline oplegt, is een in feite een universele machine’, schreef computerpionier Alan Turing in 1936. De mens programmeert de computer om dingen te berekenen die hij in theorie ook zelf wel zou kunnen berekenen, maar waarvoor zijn brein veel te traag en te onbetrouwbaar is. De overwinning van AlphaGo op Lee SeDol is daarom een overwinning van het menselijk brein op zichzelf.

En nu?

De match eindigt op dinsdag 15 maart, maar de eerste klap is al een daalder waard. Hoe de match ook afloopt, AlphaGo heeft nu al laten zien dat de computer een jaar of vijf eerder dan verwacht het niveau van een wereldtopper in go heeft bereikt. Het is een kwestie van tijd voordat de computer net als in schaken ook in Go niet meer door mensen te verslaan is.

UPDATE 10 maart: Zojuist is bekend geworden dat AlphaGo ook de tweede partij heeft gewonnen van Lee SeDol.

Bennie Mols vertelde over het evenement in het radio1-programma De Ochtend:

Bennie Mols: Mens vs machine in het bordspel Go

Bennie Mols: Mens vs machine in het bordspel Go