Исследовательская компания OpenAI, основанная и спонсируемая Илоном Маском, столкнула в противоборстве виртуальные модели сумоистов. Два искусственных интеллекта сражались в изменяющейся виртуальной среде RoboSumo. Благодаря метаобучению AI самостоятельно освоили эффективные приёмы борьбы. Метаобучение позволило принимать решения для достижения поставленной задачи, учитывая накапливаемый опыт.

Как и в настоящем сумо, ботам необходимо было столкнуть или опрокинуть оппонента. На начальном этапе моделирования борьба была хаотичной. После нескольких попыток и полученного опыта у противников появлялась тактика. Боты стали избегать соперника и анализировать собственные действия.

Было создано 1050 агентов с разной организацией тела и методом обучения. Модель RoboSumo допускала бойцов с четырьмя, шестью и восемью ногами. Они самостоятельно освоили движение и борьбу. Конкурентноспособные «особи» клонировали себя, а проигравшие — исчезали. В результате эксперимента шестиногие боты составили большинство.

Данный метод позволяет искусственному интеллекту обучаться в виртуальной среде, а затем в теле робота использовать накопленный опыт в реальном мире, но уже без дополнительного обучения. Запуск проекта OpenAI состоялся в середине 2017 года.