Pieter Edelman
30 May 2017

Met een overwinning op regerend wereldkampioen Ke Jie stuurt Google-dochter Deepmind zijn Alphago-ai-systeem voor het bordspel go met pensioen. De software schreef in 2015 geschiedenis toen het de Koreaanse topspeler Lee Sedol versloeg, en op de Future Of Go Summit in het Chinese Wuzhen wist de software afgelopen week alle drie de potjes van Jie te winnen. De Deepmind-onderzoekers willen de methodes van het taakspecifieke ai-systeem nu gaan generaliseren – het bedrijf noemt op den duur materiaalkunde en de medische sector als beoogde toepassingen.

Deepmind werkt sinds 2014 aan Alphago als testcase voor reinfocement learning. Dit wordt algemeen beschouwd wordt als de taaiste tak van machine learning. Het systeem krijgt hier slechts informatie over in- en output en uiteindelijk succes. Daarmee moet het optimale strategieën ontwikkelen. Tussentijdse stappen worden dus niet gecorrigeerd.

Go is hier een uitgelezen probleem voor. Het oosterse bordspel kent te veel mogelijke posities om brute force door te rekenen, wat min of meer de manier was waarop computers twee decennia geleden van menselijke schaakspelers wisten te winnen. Het verslaan van Sedol wordt over het algemeen dan ook als een belangrijke stap in de ontwikkeling van machine learning gezien.

Deepmind gebruikt een combinatie van methodes en strategieën om beter te worden in het bordspel, waaronder tegen tegen zichzelf spelen. Na de overwinning op Sedol eind 2015 liet Deepmind de software, aanvankelijk onder pseudoniem, meespelen in online competities. Daar wist het steevast te winnen van topspelers.

Techwatch Books: ASML Architects

Jie bestuurde deze spellen uitvoerig, maar wist Alphago desondanks niet te verslaan. De go-carrière van Deepmind wordt echter op een positieve noot afgesloten: de deelnemers toonden zich enthousiast over de nieuwe inzichten die de ai wist te genereren in het drieduizend jaar oude bordspel, niet alleen in wedstrijden tegen menselijke spelers, maar ook in dubbelmatches samen met hen. Deepmind zal de komende tijd nog resultaten en software vrijgeven, en hoopt dat de go-gemeenschap het onderzoek voortzet.