Ашманов
Важнейшие вопросы, связанные с распространением искусственного интеллекта, оказывается, почти не ставятся и совсем не решаются. По крайней мере, так было до этого интервью
// monocle.ru
Охарактеризовав популярное направление развития и внедрения в жизнь ИИ как бредогенератор, Игорь Ашманов указал на целый ряд нешуточных опасностей применения этой технологии, особенно в попытках заменить ею общение с человеком, как в госорганах, так и в коммерции, использования ее для принятия важных решений и — на другом уровне, но с далекоидущими последствиями — ее применения учащимися. А также на то, что распространение ИИ сопровождается порядочной безответственностью.
Но есть и позитив. ИИ, не генеративный, нужен нам в промышленности, необходим в военных применениях. А за пределами этих и некоторых других насущных задач мы все еще свободны от того, чтобы скормить ему миллиарды рублей и гигаватты энергии. И у нас есть возможность остаться свободными не только от материальных затрат, но и, что еще важнее, как личности, но это потребует ума — настоящего — и усилий, предпринимать которые мы пока что не разучились.
...
Короче говоря, больших лингвистических моделей много, они разные, но все они делаются преимущественно в Америке. И уж как минимум движок, который их оживляет, то есть сама нейронная сетка, нейронный фреймворк, он точно придуман и сделан в США.
Как эти модели учатся, довольно хорошо известно, есть довольно много инструментов для их инструктирования.
Существует массовая легенда, которая зацепила и наших людей тоже, что искусственному интеллекту дают просто походить по интернету, выкачать все тексты на свете, после чего он становится очень умным. Но это очень далеко от истины.
Там довольно много ручной работы, и эту работу порой делают десятки тысяч человек. В частности, есть так называемые асессоры, которых нанимают в Нигерии, в Индии и других странах, низкооплачиваемые, по возможности с английским языком, которым дают задание обучать LLM.
Например, есть вопрос к нейронке, ChatGPT или любой другой, и есть пять ее возможных ответов. Асессорам нужно выбрать оценку от «неприемлемо» до «очень хорошо» и поставить пять оценок.
- ну все же читали "Электроника"
При этом существует методичка — страниц на тридцать, как рассказывают участники, — которая объясняет, как именно выставлять оценку, что хорошо, а что плохо.
...
Наши «отечественные» большие лингвистические модели, которые у нас преподносятся как сделанные с нуля, на самом деле таковыми не являются. В первое время, когда на нашем горизонте появился ChatGPT 3.5, это произошло в январе два года назад, у нас в IT-отрасли и в медиа возникла истерика.
Люди в больших компаниях, которые до этого рапортовали наверх всем, включая самого большого начальника, о том, что у них тоже есть искусственный интеллект, что они в этом очень хорошо понимают и впереди планеты всей, пришли в ужас, потому что ничего подобного сделано не было, а начальник мог бы спросить, почему.
И дальше у них была прямо гонка, как быстро-быстро показать, что у них тоже это есть. Естественно, все было взято заподлицо, с цельнотянутыми движками, с цельнотянутыми данными и так далее, а затем переупаковано, чтобы предъявить и сказать, что у нас есть то же самое.
Поэтому эти большие модели в течение года-полутора как минимум на вопрос, кто тебя сделал, отвечали, что их сделала американская корпорация OpenAI.
Там, в этих наших цифровых гигантах, настолько люди наглые и беспардонные, что они поленились такое правило руками написать: когда спрашивают «кто тебя сделал?», надо сказать, что сделала их компания.
Они настолько были уверены, что всем заморочат голову, что поленились сделать это руками. А это, в общем-то, совершенно нетрудно.
— Как можно понять, что полноценной «переупаковки» так и не произошло? Существуют ли интерактивные системы, которые обучались преимущественно на российском контенте? Ведь их широко используют, в том числе учащиеся при подготовке ответов на учебные задания.
— Вы, наверное, слышали истории, когда генеративному ИИ-сервису говорят нарисовать гайку, а он рисует орех. Почему? Потому что в английском языке есть два омонима. Nut — это и гайка, и орех. Сразу видно, что внутри «отечественного» движка запрос сначала переводится на английский, а уж дальше происходит ошибка с выбором не того омонима.
Скриншот, на котором видно, что Алиса от «Яндекса» на просьбу нарисовать гайку рисует орех (и то и другое — nut)
Это прямое доказательство, что это цельнотянутая вещь. Потом, конечно, эта переупаковка стала проникать глубже, но, в общем, наш искусственный интеллект очень вторичен. Нет у нас своих нейронных фреймворков. Нейронный фреймворк — это что-то вроде нейронной операционной системы, которая исполняет поверх себя всякие нейронные ИИ-приложения, в том числе большие лингвистические модели.
Вот этой нейронной операционной системы у нас нет. У нас есть западные нейронки, которые мы скачиваем в исходных текстах (как Linux), здесь компилируем и потом поверх них строим эти большие лингвистические модели, очень часто тоже либо по статьям американцев, либо просто есть готовый код и данные.
А потом берем и запускаем приложения на этих нейронных фреймворках — там разные приложения есть: распознавание лиц, генерация текста, генерация голоса и так далее.
...
Все они, в общем, пытаются эту вражескую повесточку в «отечественном» ИИ-продукте как-то нейтрализовать, но она все равно вылезает в разных местах, потому что предсказать, какой вопрос задаст массовый пользователь, довольно сложно. А масса этой повесточки внутри большой лингвистической модели — гигантская, потому что был скачан гигантский объем текстов и потом обработан асессорами.
OpenAI, по некоторым сообщениям, нанимала 50 тысяч человек, которые непрерывно работали на внедрение этой повестки, на то, чтобы отшлифовать этот ChatGPT так, чтобы он был «политически правильным» с их точки зрения.
...
Я недавно разговаривал с одним помощником законодателя, который предложил на встрече некие варианты законопроекта и, немного смущаясь, сказал: «Ну я тут немножко с помощью ChatGPT сгенерировал». [b]
Вы представляете, что это такое? Человек сгенерировал законопроект для России с помощью ChatGPT и принес своему депутату.
[b]Вот это безумие вообще должно быть остановлено[/b], даже если там внутри нет вражеской повесточки.
На самом деле любое внедрение искусственного интеллекта — пусть даже отечественного — в образовании, в общении с гражданами, когда, например, чиновники сейчас вместо себя выставляют чат-ботов, — это возможность снять с себя ответственность и вообще просто не допустить граждан к общению с властью, поставить им барьер. Потому что чат-боты тупые, реальных проблем они не решают, но заговаривают зубы, а пробиться к живому оператору практически нельзя.
Та же самая проблема есть, естественно, и в коммерческих компаниях. Там тоже клиентская поддержка давно уже не помогает клиенту, а отгоняет его, снижая нагрузку на контакт-центр и экономя деньги на живых операторах.
Надо понимать, что внедрение искусственного интеллекта в социальную сферу везде кардинально понижает качество взаимодействия. Именно понижает, а не улучшает. И приучает людей к низкому качеству. Это такой ментальный доширак.
Вообще, надо понимать, что это бурное внедрение ИИ везде в социальной сфере, в обществе, государстве, которое идет с подачи цифрового бизнеса, чиновников-цифровизаторов и так далее, абсолютно безответственно, потому что мы не понимаем, что именно внедряется, это черный ящик, а возможно, к тому же с чужой повесткой.
Самый простой способ это проверить — дать один и тот же запрос генеративному ИИ несколько раз. Ответы каждый раз будут разные. Часто противоречащие предыдущим.
Методов сертификации нет, а если у вас гигантская база на многие петабайты текстов внутри, как понять, что она не выкинет какую-то непредсказуемую штуку?
— Нам нужно очень жесткое регулирование искусственного интеллекта. И, скорее всего, сейчас нужно «охлаждение» цифровизации и внедрения ИИ, то есть постановка на паузу внедрения искусственного интеллекта в социальную сферу, в общение граждан с государством, в «Госуслуги», в юриспруденцию, в законотворчество, да и в журналистику тоже.
В журналистике вообще нужно создать какой-то аналог «Честного знака», чтобы в начале любого журналистского текста было написано: «Не ChatGPT, не сгенерировано искусственным интеллектом». Или, если текст был сгенерирован, это должно быть помечено, как с пищей (содержит глютен, аллергены, орехи, прочее).
...
Нам надо с этим угаром внедрения ИИ бороться и написать нормальный закон, который в основном будет запретительным, который будет говорить, чего категорически нельзя делать в социальной сфере.
Например, нельзя принимать с помощью искусственного интеллекта автономные решения, юридически значимые, которые влияют на судьбу человека. Нельзя заменять учителя, нельзя общаться без объявления, обманывать, антропоморфизировать искусственный интеллект, притворяться, что он человек, то есть заниматься имперсонацией.
— Тем временем цифровизаторы пытаются построить себе дорогу в светлое цифровое будущее. Есть документ, который недавно разослало в разные органы, в том числе в Совет по правам человека, Министерство цифрового развития, под названием «Концепция регулирования искусственного интеллекта до 2030 года».
...
Авторы концепции все время пишут о том, что надо снять ответственность с разработчика, нельзя душить разработку, иначе мы отстанем.
...
Для чего нам нужен ИИ и для чего он не нужен вовсе
— Мы отстали, проиграли эту нейронную гонку, судя по всему. Какие у нас есть шансы если не перегнать, то приблизиться, если не приблизиться, то сдвинуться с места?
— Это вопрос, некорректно поставленный, и я сейчас объясню почему. Потому что совершенно непонятно, а куда отстали. Где цель, куда мы все бежим?
Вот в космосе было понятно, там одно направление — вверх. Вон над головой наш спутник летает, а их — нет. А вот здесь мы куда бежим? То есть у нас какая нужда делать бредогенератор еще более гладким или быстрым, чем у американцев?
...
Вот нам что, надо вот туда спешить? В этот прекрасный новый мир идиотов? Это нам зачем?
...
— Но если с точки зрения развития нейронных сетей, самой технологии?
— Еще раз: весь ажиотаж сейчас — вокруг генераторов. Больших лингвистических моделей. Бредогенераторов.
Предыдущая вспышка хайпа была по поводу распознавателей, когда научились распознавать объекты, лица, речь распознавать и так далее. Сейчас — по поводу генераторов. Это, конечно, пузырь.
Кто сказал, что нам нужно гнаться за генерацией вот этого всего? Чтобы что? Чтобы нагенерировать вавилонскую башню этой чуши? А зачем? Чтобы оказаться внутри полностью сфальсифицированной Вселенной?
Сами по себе нейронные сети — это полезная вещь. Они сейчас применяются во многих отраслях.
— А в каких именно? И какие из них приоритетны для нашей страны?
— Например, в оборонной области — где у нас, кстати, все довольно хорошо. У нас сейчас на линии боевого соприкосновения летает много наших дронов с искусственным интеллектом. Я наблюдаю относительно близко людей, которые это все делают. Там все хорошо. Мы не отстаем и даже, в общем, часто опережаем.
На войне сейчас самое важное — это захват цели беспилотником, управление беспилотником, ПВО, контрбатарейная борьба — это все распознавание, управление. Это не генерация бессмысленных текстов и картинок.
Что касается промышленности, там тоже ИИ — это в основном не болталки, а предиктивная аналитика, распознавание всяких дефектов, проектирование. У нас в области экономики и обороны более или менее понятно, куда двигаться. Там нельзя как минимум отстать, иначе нас победят, в частности на войне.
Но вот принять идею, что искусственный интеллект будет за государственных мужей выдумывать стратегии, принимать решения и так далее, — это все равно что говорить, что мы хотим стать той девочкой, которая просто будет нажимать кнопку для передачи вопросов-ответов мимо мозга. То есть идея, что американцы отупеют окончательно, как та девочка, и поэтому нас каким-то образом обгонят — очень странная.
Нам-то зачем тупеть? С какой стати нужно делегировать мышление вот этой… технологии? Она что, будет лучше нас мыслить? Ну нет, конечно.
- хотя и напрашивается парадоксальная мысль, что, возможно, на месте законодателей искусственный интеллект не допустил бы внедрения искусственного интеллекта
ChatGPT собирает не знания, а некую информацию, которая знанием не является, из текстов. Но в текстах, даже если вы возьмете все тексты мира, только процентов десять информации, а тем более знаний, которыми мы пользуемся для жизни, для принятия решений и так далее.
Например, в текстах нет или мало сведений о том, что у лошади или кошки — четыре ноги. Ну вы почти этого нигде в текстах не найдете, потому что человеку это очевидно. То есть что-то будет, но очень редко, с низкой частотой. А большие лингвистические модели построены на частотности.
В текстах практически нет прагматики реального мира. Например, прагматического знания, что на правой руке большой палец слева, а на левой руке большой палец справа. И что пальцев пять.
Вы же помните, что очень долго генераторы картинок рисовали руки какие угодно, с многосуставчатыми пальцами, торчащими в разные стороны. Почему? А это в текстах не было описано, а на существующих картинках плохо видно и слишком разнообразно, тоже не собирается в единую модель, хотя для человека это самоочевидно. Потом это как-то полечили в графических моделях — думаю, практически вручную.
И вот этой прагматики реальной жизни, которую мы используем для принятия решений, ее очень много, она невербальна, она не в текстах и не в картинках.
- ну собственно о чём и я который год талдычу, что видов интеллекта много, в т.ч. отдельно пространственный, моторный и т.п.