Prima pagină » Ştiinţă-Sănătate » AlphaGo Zero, program dezvoltat de DeepMind, a reuşit să înveţe singur să joace jocul Go

AlphaGo Zero, program dezvoltat de DeepMind, a reuşit să înveţe singur să joace jocul Go

DeepMind, o companie deţinută de Google, a anunţat că programul AlphaGo Zero a reuşit să înveţe singur şi să devină cel mai bun jucător al jocului strategic Go, în doar 72 de ore, fără să se inspire din partidele jucătorilor umani, informează BBC News online.
AlphaGo Zero, program dezvoltat de DeepMind, a reuşit să înveţe singur să joace jocul Go

Programul AlphaGo, dezvoltat în 2015 de DeepMind, a reuşit să învingă doi dintre cei mai mari jucători contemporani de Go, învăţând să joace prin analizarea a mii de partide jucate de oameni.

Noul program, AlphaGo Zero, a început de la zero, pornind doar de la regulile jocului şi a învăţat doar jucând milioane de jocuri de unul singur.

După doar 72 de ore, noul program a reuşit să învingă categoric toate versiunile programului anterior, AlphaGo.

David Silver, care a participat la dezvoltarea noului program, a declarat echipa a folosit o abordare diferită în cazul AlphaGo Zero faţă de programul anterior.

„Noua versiune începe cu o reţea neurală care nu cunoşte nimic despre jocul de Go”, a explicat el.

„Cunoaşte doar regulile jocului. În afara de asta, învaţă totul doar jucând partide împotriva şieşi”, a completat Silver.

În timp ce versiunile anterioare au învăţat şi îmbunătăţit strategiile umane, AlphaGo Zero a dezvoltat metode despre care un jucător profesionist care a consiliat DeepMind a declarat că nu le-a mai văzut niciodată.

„De fapt am eliminat limitările cunoaşterii umane şi astfel (programul) este capabil să creeze singur cunoaştere pornind de la principii de bază, de la zero”, a completat Silver.