Технологии

Алгоритм компании DeepMind превзошел почти всех игроков в StarCraft II

время публикации: 31 октября 2019 г., 18:52 | последнее обновление: 31 октября 2019 г., 18:52

Zach Tirrell / flickr.com

Разработчики из компании DeepMind (входит в состав владеющего Google холдинга Alphabet) сообщили, что их алгоритм AlphaStar, разработанный для игры в StarCraft II, вошел в число грандмастеров, поскольку занял место среди 0,15% лучших игроков на европейских серверах. Статья об этом достижении была опубликована в журнале Nature.

Как пишет N+1, алгоритму удалось обыграть свыше 99,8% геймеров из почти 90 тыс. официально зарегистрированных на европейских серверах, причем побед алгоритм добивался в играх против всех трех рас. И хотя самых сильных игроков программа одолеть не смогла, ее результаты позволяют присвоить AlphaStar звание грандмастера.

"Меня очень впечатлил стиль игры AlphaStar. Она очень умело оценивает свою стратегическую позицию и точно знает, когда должна вступить в сражение с соперником, а когда стоит отступить. При этом я не чувствовал, что играл со сверхчеловеком, которого в принципе нельзя превзойти. Мне казалось, что мне противостоит реальный человек", - приводит ТАСС комментарий одного из ведущих игроков в Starcraft II Дарио Вюнша.

Для обеих частей StarCraft уже давно разрабатываются боты, но до появления AlphaStar таким алгоритмам не удавалось победить человека. Основная сложность обучения программ для этих игр заключается в том, что они представляют собой стратегии в реальном времени, в которых часть информации закрыта, а игрокам нужно решать большое количество задач одновременно.

Ранее в DeepMind уже пытались создать алгоритм для игры в StarCraft II, но те попытки не увенчались успехом. В процессе разработки AlphaStar в DeepMind использовали метод глубокого обучения с подкреплением, а также обучение с учителем. В качестве тренировочного датасета разработчики использовали предоставленные компанией Blizzard анонимизированные записи игр настоящих людей. Когда обученная на этих играх нейросеть научилась побеждать встроенные алгоритмы StarCraft II на самой высокой сложности в 95% случаев, создатели заставили программу играть с самой собой в течение двух недель. При этом разработчики ограничили скорость реакции AlphaStar таким образом, что скорость его управления была сравнима с реальными игроками.

В январе этого года стало известно, что AlphaStar смогла всухую обыграть двух профессиональных игроков в StarCraft II в сериях из пяти матчей. На организованном в Лондоне турнире AlphaStar сперва выиграла пять матчей из пяти против геймера под ником TLO (Дарио Вунш, Германия), а затем другая версия нейросети пять раз подряд победила игрока MaNa (Гжегож Коминч, Польша).

Напомним, в июле прошлого года в DeepMind смогли обучить программу под названием For The Win играть в Quake III Arena не хуже настоящих геймеров.