tarasv> Я про первую версию. Тут Сверхчеловеческую скорость AlphaStar внедрили как заплатку для ошибки имитационного обучения? / Хабр перевод на русский разбора стиль игры AlphaStar год назад. То насколько быстро и точно кликала программа физически не мог повторить даже уникальный по способностям игрок. Но AI проиграл как только игрок решил не заниматься безнадежным делом перекликивания робота в догфайте и проапгрейдил свои юниты.
Я не вижу, честное слово, смысл обсуждать, за счёт чего
выиграл ИИ, я не старкрафтер-профи и мне в целом пофиг, кто там выиграл. Мне в этой игре интересен тот факт, что комп играет на равных. Обладая той же информацией, что и человек, принимает вполне верные стратегические решения.
Если ты смотрел видео игр, то там очень хорошо видно, что ИИ не ведёт себя как типичный скрипт "защитился-накопил армию-напал". Он быстро адаптируется под действия человека, причём, как тактические, так и стратегические (посмотри - его армия эффективно контрит человеческую). Это не повторение некоей "в целом успешной" комбинации из предыдущих игр. Посмотри на перемещение армий по карте - ИИ именно играет, принимая решения по ситуации. Посмотри на успешные атаки тылов (тактика, которую очень сложно заскриптовать, именно потому, что нужно учитывать и реагировать на оборону противника, в том числе и стратегически - при постройке атакующих юнитов).
Нет, ИИ в этом смысле довольно честный.
То, что он выигрывает тактически за счёт механики - ну, КМК, излечимо: снизить максимально доступный кликбейт, внести погрешности в клики и потренировать ещё.
tarasv> Но "Как играть" это не набор правил хорошей игры. Это опыт людей. AlphaGo была иницирована огромным набором игр сыгранных людьми. То есть не сыграв ни одной партии AI уже имел багаж "знаний" как играют лучшие игроки.
А, в этом смысле... Тогда - да. Конечно. Но это универсальное правило любого известного нам интеллекта: "учись на лучших примерах". Студентов, прежде чем они станут, допустим, физиками, годами натаскивают на физику не просто излагая текущий уровень... Нет, излагают исторически, по времени, очень часто даже в ущерб общей логичности и связности изложения, чтобы люди могли посмотреть, какими изгибами шла мысль великих, где они упирались в тупики, и что им помогало тупики преодолеть.
Заметь - везде в хороших учебниках приводится именно вывод формулы.
Опыт людей "как играть". Опыт лучших людей. И побед, и многие достойные поражения.
Ессно, что не давать ничего подобного ИИ - просто глупо. А вот дальше - отталкиваясь от этой базы - ему уже придётся самому.
Я понимаю возражение насчёт возможных "слепых зон": мол, если бы ИИ играл только сам с собой, может быть он не допёр до целого класса возможностей. Но и контраргумент тут тривиальный: на это у нас (да, и у человека) есть генератор случайных и бессмысленных (в большинстве случаев) решений, который выводит из логических локальных тупиков. Обладая достаточным временем и генератором случайных чисел можно найти что угодно. Машина этим обладает. А не терять время на проверку
вообще всех возможностей ей поможет то же, что и человеку - дальнейшее сочетание безумной идеи с опытом и консервативными подходами.