Programul AlphaGo, dezvoltat în 2015 de DeepMind, a reuşit să învingă doi dintre cei mai mari jucători contemporani de Go, învăţând să joace prin analizarea a mii de partide jucate de oameni.
Noul program, AlphaGo Zero, a început de la zero, pornind doar de la regulile jocului şi a învăţat doar jucând milioane de jocuri de unul singur.
După doar 72 de ore, noul program a reuşit să învingă categoric toate versiunile programului anterior, AlphaGo.
David Silver, care a participat la dezvoltarea noului program, a declarat echipa a folosit o abordare diferită în cazul AlphaGo Zero faţă de programul anterior.
„Noua versiune începe cu o reţea neurală care nu cunoşte nimic despre jocul de Go”, a explicat el.
„Cunoaşte doar regulile jocului. În afara de asta, învaţă totul doar jucând partide împotriva şieşi”, a completat Silver.
În timp ce versiunile anterioare au învăţat şi îmbunătăţit strategiile umane, AlphaGo Zero a dezvoltat metode despre care un jucător profesionist care a consiliat DeepMind a declarat că nu le-a mai văzut niciodată.
„De fapt am eliminat limitările cunoaşterii umane şi astfel (programul) este capabil să creeze singur cunoaştere pornind de la principii de bază, de la zero”, a completat Silver.