ИИ побеждает людей в Quake III

0
23

Группа исследователей из DeepMind разработала механизм, анализирующий поведение игроков в многопользовательских онлайн шутерах. Мультиагентное обучение позволило выработать командную тактику и перестроить взаимодействия между ботами для повышения вероятности победы в раунде.

Овладение стратегией, тактическое понимание и командная игра, участвующие в многопользовательских видеоиграх, представляют собой важную задачу для исследований в области искусственного интеллекта.

DeepMind использовала мультиагентное обучение. Отдельно взятые агенты должны действовать самостоятельно, но при этом взаимодействовать с другими агентами. Для рассмотрения этой проблемы хорошо подходят многопользовательские онлайн-игры от первого лица. Это популярный жанр видеоигр и захватывающий воображение миллионов геймеров.

Система агентов в Quake III

Специалисты в области машинного обучения решили использовать мультиагентное обучение на примере Quake III Arena в режиме «Захват флага» (Capture the flag или CTF). Разработчики создали агентов, которые учатся и действуют как отдельные лица, но при этом они умеют играть в командах с другими ботами и реальными людьми.

Правила CTF просты, но динамика сложна. Две команды игроков соревнуются с целью захвата флага команды противника, защищая свой флаг. CTF требует от игроков сотрудничества с товарищами по команде в условиях конкуренции с противоположной командой.

Вместо обучения отдельного агента специалисты тренировали популяцию агентов, которые совершенствовались, играя друг с другом. Агенты работают в двух временных масштабах, быстром и медленном. Это улучшает их способность использовать память и генерировать последовательности действий.

Система получила даже собственное имя: «За победу» (For the win или FTW). Она является устойчивой к размеру карт, количеству товарищей по команде и количеству противников.

Проверка ИИ в Quake III

В DeepMind проверили свой алгоритм в условиях турнира, где люди и агенты были перемешаны случайным образом. В одной команде могли оказаться и люди, и агенты. Система агентов продемонстрировала хорошие результаты, одержав большее число побед по сравнению с настоящими игроками.

Читайте также:  Alibaba научила искусственный интеллект писать описания товаров

На сайте разработчиков приводятся видеозаписи игры. На записях представлены внутренние процедурные среды и действия агентов в самой игре.

ОСТАВЬ КОММЕНТАРИЙ

avatar