Шахи - непроста гра. Принаймні за людськими мірками. Але для надпотужного штучного інтелекту це звичайна забава, яку можна освоїти за вельми короткий час, передає TrueUA з посиланням на The Guardian.
Інженери з Google в деталях розповідають про те, як їх новітня ІІ-конфігурація AlphaZero змогла розвинути «надлюдські можливості» в шахах всього за кілька годин.
Після того, як в систему внесли лише базовий набір правил (без стратегій), AlphaZero потрібно лише чотири години на те, щоб освоїти гру настільки добре, що перед ним упав навіть найсильніший в світі шаховий движок Stockfish.
Після серії з 100 ігор проти Stockfish ІІ-алгоритм AlphaZero здобув перемогу 25 разів за гру білими фігурами і три рази за гру чорними. Решта всіх партій обидві системи зіграли внічию. В результаті Stockfish не змогла перемогти жодного разу, а AlphaZero, в свою чергу, жодного разу не програла.
«У нас з'явився новий володар шахів. Це без сумнівів революціонізує гру, але було б непогано подумати і про те, як це може бути застосовано поза шахів », - прокоментував результати Девід Крамалей, дослідник шахової гри і головний редактор сайту Chessable.
Система AlphaZero грунтується на напрацюваннях ІІ-алгоритмів AlphaGo і AlphaGo Zero, творцями яких є інженери лабораторії штучного інтелекту DeepMind, що належить Google.
DeepMind займається вдосконаленням цих ІІ-алгоритмів вже протягом декількох років, попутно перемагаючи за допомогою них кращих в світі гравців в древню логічну гру го. Кульмінація переможної серії відбулася в жовтні цього року, коли нова і повністю автономна версія ІІ-алгоритму AlphaGo, навчалася виключно на грі з самою собою, а не проти людських опонентів, перемогла всі свої попередні версії.
У той же час попередні версії алгоритму AlphaGo Zero частково навчалися грі за допомогою спостереження за тим, як грають люди.
Таким чином розробники хотіли допомогти їй у вивченні стратегій гри, але, як виявилося, насправді це її лише сповільнило в розвитку.
«Це як спостерігати за інопланетною цивілізацією, винаходити свою власну математику», - говорив в інтерв'ю порталу Gizmodo ще в жовтні Нік Хайнс, вчений MIT, що працює в області комп'ютерних наук.
«Те, що ми тут бачимо, це самостійна, самодостатня модель, створена з виключеним фактором людських забобонів. Вона самостійно здатна навчатися тому, що сама вважатиме оптимальним, що, безумовно, буде диференціювати її від наших власних концепцій».
Однак розвиток сфери ІІ відбувається настільки швидко, що те, що було досягнуто до жовтня цього року, могло вже застаріти.
В опублікованій статті інженери DeepMind відзначають, як найостанніша версія AlphaZero перейшла на новий рівень і здатна займатися вирішенням більш широкого кола завдань.
Це означає, що тепер AlphaZero здатна не тільки чудово грати в шахи.
Вона також відмінно справляється з сьогі (японської настільною грою) і го, в яких досягти досконалості їй вдалося всього за 2 і 8 годин відповідно.
Поки ні інженери Google, ні інженери DeepMind відкрито не виступали з коментарями з приводу нових результатів своєї роботи, вони очікують стороннього і незалежного експертного аналізу.
Правда, вже зрозуміло, що сходження даного алгоритму до вершин штучного інтелекту ще далеко до свого завершення, але вже зараз він настільки крутий, що його визнають навіть гросмейстери.
«Завжди хотів дізнатися, як би виглядала гра в шахи між більш розвиненими видами, що висадилися на Землі. Тепер знаю», - прокоментував результати AlphaZero гросмейстер Петер Хейне Нільсен.