Fakir> Не понял. Что значит "дошли" и "могут"? Они УЖЕ могут - вчера или хотя бы сегодня с обеда - и это доказано опытом? Или лишь есть мнение/ощущение, что "еще чуть-чуть, и вот..."?
Fakir> В теории я с таким тезисом согласен - что В ПРИНЦИПЕ может быть. Но вот что "уже" или хотя бы "вот-вот" - чо-т сильные сомнения.
Смотри чего раньше (совсем давно уже) было: у сетки есть n входов и m выходов, на один из входов через внешнюю схему подаётся ошибка (или критерий соотвествия, или сигнал успеха - как хочешь назови; в общем "насколько получилось"). Сетка получает входы, что-то делает (через сигнал на выходах) в реальном мире, потом внешняя схема говорит "плохо: -0.59" или "плохо: -0.01".
Это может быть непрерывный процесс (типа, обучаем механическую птичку орудовать крыльями чтобы взлететь, какой-нить ультразвуковой датчик говорит нам, насколько высоко и надолго мы взлетели) или что-то разовое (составляем прошивку ПЛИС генератора некой частоты, а цифровой осциллограф с фурье-анализатором даёт нейросети отклик с реальной схемы). Это может быть всё вместе (например, куча нейроуправляемых независимых колобков учатся закатывать мяч в дырку).
Вроде как "сетка учится сама". Но. Куча "но", даже перечислять лень.
Главная проблема: требуется очень много проб и ошибок. В реальном мире такое обучение очень дорого. Практически что-то получается только если, разве что, задача ну очень простая, с очень простыми критериями (вот как с управлением приводами оритоптера и критерием решения типа "ну взлети хоть как-нить").
Почему всё это мимо практической жизни, даже нет смысла говорить. Очень интересно теоретически, возбуждает и вдохновляет и на запрос университетских грантов, и на их выдачу, но это вообще не про реальный бизнес.
Но случились трансформеры-БЯМ. Казалось бы, вообще из другой оперы. Ну где бредогенератор, выросший из подстановщика слов, и где управление манипулятором? Ну да. Но нет.
Две вещи: во-первых, прорыв в работе с сложными токенизированными данными у трансформеров. Сложная последовательность действий или взаимодействие между большим количеством объектов очень хорошо вписываются сюда. То же самое с "пространственным мышлением" (что мучало всё это время).
А во-вторых, сами БЯМ - уже сожрали знания всего человечества в каких случаях что и как надо делать. Тебе уже не нужно годами натаскивать машину на "яблоки" и "груши" и объяснять, что всё это "фрукты", натаскивать на действиях в реальном мире отношения "яблоков" со "столом" и вот всё это.
В БЯМ эти связи уже есть, их нужно просто уметь извлекать - давать постоянно меняющийся промпт запроса и получать ответы в адекватном для остальной сети виде.
Вот те же Фигуре1, которые пробовали на БМВ к делу приспособить - накручивать там что-то на куда-то: у них изначально сверхсокращённое обучение, потому что они уже "знают", что такое шуруповёрт. Вряд ли у них получится сразу что-то годное, на это ещё годы пойдут, но сейчас подгоняется следующий этап развития БЯМ (уже не совсем БЯМ, но выросли из них) - "рассуждающие сети". Системы с решением задачи в несколько этапов: многократным анализом, пошаговым решением, "сборкой".
Та же о3 в сравнении с GTP 2.0 для пользователя не отличается ничем: тот же генератор текста, просто генерит текст более адекватный, и адекватный в бОльшем количестве случаев, а неадекватный в меньшем. Разница для пользователя чата кажется чисто количественной.
Но она именно качественная: никаким уже натаскиванием на бОльшее количество текста, ты не научишь систему решать те же математические задачи.
И вот сейчас только-только эти сети начинают привлекать к самообучению в реальном мире.
Разница - в количестве требуемых для обучения проб. Там миллионы-квинтиллионы раз разницы. Ситуации, что раньше было просто невозможно представить для обучения (потому что "да сколько ж всего нужно перепробовать!") сейчас для машины уже посильно освоить самостоятельно.
И, например, когда подобные хрени примотают синей изолентой к автопилоту, ему уже не нужно будет объяснять, как, что и в каких случаях объезжать по обочине можно, когда и как - нельзя. Точнее, скорее всего - всё равно нужно, но уже далеко не каждый возможный случай в деталях.
Понимаешь?
И даже когда придётся особо объяснять, это уже можно будет сделать человеческим языком, а то и вовсе выдать пачку полицейских репортов по ДТП и сказать - вот, сама читай, чего бывает и думай, как этого избежать. И это уже не метафора и даже уже не гипербола ни разу.
![131.0.0.0](/_bors/images/browsers/google-chrome.png)