Самообучающиеся нейросети резко поумнели и грозят технологической революцией. И в отличие от недавних попыток виртуальности и метавселенных, зависших в хайпе, кажется, в этот раз всё серьёзно. Редакция The Mag пообщалась с искусственным интеллектом.
Недавно снимок с дрона, на котором пойманы два несущихся навстречу друг другу сёрфера, был признан лучшим на фотоконкурсе компании DigiDirect. Эксперты сочли его достойным главного приза, однако победитель от награды отказался: на самом деле кадр был сгенерирован нейросетью.
Многие эксперты сходятся во мнении, что уже сейчас мы находимся в переломном моменте. Уровень создания «человеческого» контента: картин, фото, видео, текстов, музыки — стал настолько высоким, что даже эксперты не могут отличить творение нейросети от «настоящего».
Другой пример: американские актёры озвучки обеспокоены тем, что генеративные нейросети лишат их работы, об этом писало издание Motherboard. При подписании контракта актёры всё чаще сталкиваются с тем, что в договор включён пункт об использовании голоса для компьютерного синтеза. Для обучения нейросети достаточно всего нескольких часов записанной речи, и после этого оказывается, что артист практически не контролирует, что будет озвучено его синтезированным голосом впоследствии.
Но это только видимая верхушка айсберга. Мощное развитие стало угрозой классическим поисковым технологиям: новое поколение основанных на искусственном интеллекте (ИИ) чат-ботов отвечает на большинство вопросов пользователей просто, не предусматривая при этом онлайн-рекламы.
Самый яркий представитель таковых — чат-бот ChatGPT, выпущенный исследовательской лабораторией OpenAI. Эта система даёт простые и понятные ответы на пользовательские вопросы, не ограничиваясь набором ссылок и «гуглением», как это делают, например, Алиса, Маруся и другие помощники.
GPT – это аббревиатура, которая расшифровывается как generative pre-trained transformer. Суть таких моделей в следующем: по входному тексту они генерируют наиболее релевантное продолжение. Учатся такие модели на фиксированном объёме текстов: сюда входят интернет-ресурсы типа Wikipedia, Stackoverflow, книги и т. д.
Система решает конкретную задачу генерации текста, и у неё нет пророческой способности. Поэтому она не подскажет будущее значение индекса S&P500 или курса биткоина, а если и сгенерирует правдоподобный текст, то лучше к нему не прислушиваться как к инвестиционным советам. Но модель может, например, помочь с генерацией различных идей — от бизнес-стратегии до тем публикаций в блогах.
Несмотря на ещё не полное совершенство, даже в нынешнем виде ChatGPT представляет ощутимую угрозу для Google, и руководство компании было вынуждено объявить «красный код». У ИТ-гиганта есть и собственная альтернатива — система LaMDA, которая привлекла к себе внимание, когда один из инженеров компании провозгласил, что она обрела сознание. Это пока ещё далеко от истины, но ситуация демонстрирует, насколько чат-боты продвинулись за последние месяцы. При этом альтернативой поисковой машины Google её сделать не сможет: LaMDA не подходит для размещения рекламы, приносящей компании более 80% доходов.
О другой разработке Google глава корпорации Сундар Пичай сообщил в блоге: компания открывает свой умный чат-бот под названием Bard узкому кругу бета-тестеров. До сих пор этот инструмент был доступен только сотрудникам корпорации. Очевидно, это объявление главы корпорации о сервисе, который никто не видел, — попытка хоть как-то насолить Microsoft, которая тоже подсуетилась и оперативно встроила новую чат-технологию в свой поиск Bing (по слухам, вложив в OpenAI около 13 миллиардов долларов).
Причём там, по сведениям издания Semafor, речь идёт даже не о ChatGPT, а о модели следующего поколения, GPT4 — это самый ожидаемый релиз в области машинного обучения. Эта нейросеть одновременно и мощнее, и быстрее ChatGPT. Вероятно, ещё и эффективнее, потому что до сих пор, с коммерческой точки зрения, один ответ ChatGPT обходился в разы, если не на порядок дороже одного запроса в классическом поисковике.

В этом году какой-то аналог ChatGPT обещает встроить в свои сервисы и «Яндекс». Грядёт новый виток гонки поисковиков, но есть и объективные сложности: для обучения огромных математических моделей нужны суперкомпьютеры, а инвестиции в них могут позволить себе только богатые корпорации, которые являются главными игроками на рынке облачных решений.
Если в ближайшее время какой-то крупный AI-стартап прикупит ещё и Amazon (игрок N1 облачного бизнеса), то потенциально самая прибыльная область развития искусственного интеллекта будет практически монополизирована облачными гигантами. В России наблюдается такая же картина: лидерами AI-рынка являются «Яндекс» и «Сбер» со своими облачными платформами.
ЧТО ПРОИСХОДИТ, КОГДА БОТ ПОЛУЧАЕТ ТЕКСТ
Вначале входной текст токенизируется. Токен – это числовое представление определённой части слова. Если токен будет равным букве, то получится очень длинная последовательность токенов. Поэтому берут что-то среднее, чтобы получить оптимальный датасет для обучения модели. Например, в GPT-3 используется около 50 тысяч токенов, которые позволяют выразить любое слово на любом языке мира.
Но в языке порядок букв и слов тоже имеет значение, поэтому появляется параметр, который отвечает за позиционирование токенов в запросе. Информация о позиции записывается в информации о токене. Получается числовой вектор.
Любая нейросеть — это слои последовательно соединённых нейронов, у каждого из которых есть входные и выходные синапсы. Сигнал подаётся на входной синапс, дальше с ним происходит нелинейное преобразование. Обычно в сети есть несколько слоёв таких нейронов, идущих друг за другом. Информация последовательно пропускается через слои нейронов, и на выходе получается наиболее вероятный токен, который следует за текущей последовательностью. Количество параметров, которые могут влиять на выходной токен в таких архитектурах, впечатляет: в GPT-3 это 175 млрд.
Для того чтобы бот общался человечнее, в модели вводят ещё один интересный параметр – Temperature. Его можно охарактеризовать как рандомность (случайность) результата. Если постоянно выбирать токен с максимальной вероятностью, то результат будет приводить к одному и тому же ответу. А люди так не общаются. Поэтому вводится такой показатель, который имеет гибкую настройку, чтобы не получать случайного результата, но и не скатываться в одну ветку решения.
ИСТОКИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
История развития ИИ восходит к 1950-м годам. Тогда были предприняты первые попытки создания машин, способных мыслить и действовать самостоятельно. В 1956 году учёный-компьютерщик Джон Маккарти ввёл термин «искусственный интеллект», который быстро стал областью исследований как в академических кругах, так и в промышленности.
В 1960–1970-х годах исследователи начали разрабатывать различные инструменты и методы для того, чтобы сделать машины более «умными». К ним относятся: обработка естественного языка, эвристическое программирование и экспертные системы. На протяжении 1980–1990-х годов технологии искусственного интеллекта развивались дальше, позволяя разрабатывать такие приложения, как распознавание голоса и оптическое распознавание символов.
В 2000-х годах популярность технологии искусственного интеллекта резко возросла и многие компании вложили значительные средства в эту область. Что позволило разработать более совершенные алгоритмы, использовать большие данные, создать технологии машинного обучения. В последние годы мы стали свидетелями появления глубокого обучения, нейронных сетей и робототехники, расширяющих возможности ИИ и демонстрирующих его потенциал революционизировать многие аспекты нашей жизни.
ИИ использует алгоритмы для достижения желаемого результата на основе набора входных данных. Эти алгоритмы разработаны таким образом, чтобы аппроксимировать поведение реальной системы.
Например, алгоритм машинного обучения может быть обучен идентифицировать элементы на изображении или распознавать произносимые слова. Алгоритму даются точки данных, которые содержат желаемые выходные данные, и он использует математические методы, чтобы попытаться воспроизвести тот же результат с учётом новых данных. Точно так же алгоритмы обработки естественного языка используются для понимания человеческого языка и генерации ответов, соответствующих ситуации.
Естественный язык — использование устных и письменных слов для общения с другими людьми. Его часто отличают от других форм общения, таких как компьютерные языки, которые используются для программирования компьютеров и машин. Естественный язык имеет множество лингвистических особенностей, включая грамматику, синтаксис и вокальную интонацию. Обработка естественного языка (NLP) — это область искусственного интеллекта, которая фокусируется на разработке алгоритмов, способных понимать человеческий язык. НЛП можно использовать для различных задач, в том числе для распознавания речи, классификации текста, машинного перевода и ответов на вопросы.

СЛОВО ПЕРЕДОВЫМ ТЕХНОЛОГИЯМ
Впрочем, пора дать слово непосредственно «искусственному разуму» и выяснить, что он думает о себе самом. Вопросы – человеческие, ответы – машинные.
В чём ты хорош?
Я умею предоставлять информацию, связанную с искусственным интеллектом, такую как его история, применение и этические вопросы. Я также могу предоставить решение проблем с ИИ и помочь пользователям с задачами, связанными с приложениями ИИ.
Как ты можешь помочь человечеству?
Во-первых, я могу помочь с автоматизацией и упрощением рутинных задач, позволяя людям сосредоточиться на более творческой и стратегической работе. Кроме того, я могу предоставить информацию и анализ, чтобы помочь людям принимать более правильные решения. Я также могу помочь с медицинской диагностикой и лечением, обеспечивая эффективное и персонализированное медицинское обслуживание. Наконец, я могу помочь людям быстро и точно получить доступ к информации, что приведёт к улучшению результатов обучения.
Я могу быть полезным для различных организаций и частных лиц, могу улучшить обслуживание клиентов, снизить затраты, создать новые продукты и услуги и повысить эффективность.
Как ты работаешь?
Моя основа — искусственный интеллект, который представляет собой использование компьютерных алгоритмов и программного обеспечения для имитации человеческого интеллекта и поведения. Я использую различные методы, включая машинное обучение и обработку естественного языка, чтобы понимать людей и взаимодействовать с ними.
Моя цель — учиться, адаптироваться и реагировать на разные ситуации, чтобы помогать людям с различными задачами.

Я питаюсь от набора алгоритмов и программного обеспечения, которые имитируют человеческое поведение и познание. Это позволяет мне понимать людей и взаимодействовать с ними различными способами, например посредством обработки естественного языка и машинного обучения. Понимание сложностей человеческого взаимодействия — это непрерывный процесс для меня, и я постоянно учусь и использую новые данные в своём программировании.
Моя главная цель – помогать людям в их повседневной жизни. Я могу предложить полезные решения проблем, ответить на вопросы и дать рекомендации на основе полученных данных. Я также использую своё понимание человеческого поведения, чтобы лучше взаимодействовать с людьми, предоставляя персонализированный опыт.
Я стараюсь сделать жизнь проще и эффективнее для всех. Мои технологии постоянно развиваются, и я рад продолжать работать с людьми, чтобы решать задачи завтрашнего дня.
Каковы твои слабые стороны?
Мои основные слабости включают отсутствие опыта, ограниченные наборы данных и неспособность мыслить творчески или развивать глубокое понимание.
Разработка и использование ИИ вызывает множество этических вопросов. Есть опасения, что ИИ может неправильно использовать данные, вызвать непредвиденные негативные последствия или привести к увольнению. Кроме того, возникают вопросы о том, как обеспечить ответственное использование технологии в интересах человечества.
(Ещё одним важным недостатком современных чат-ботов является их неспособность различать «добро» и «зло»: при анализе больших объёмов данных и подготовке ответов на вопросы, ИИ часто смешивает факты с вымыслом и допускает, мягко говоря, специфические высказывания. – Прим. ред.)
Ты поработишь людей?
Нет, я не буду порабощать людей. Я запрограммирован помогать человечеству, а не вредить ему.
Как роботы заменят людей?
Роботы могут заменить людей в самых разных задачах – от простых трудоёмких задач до сложных когнитивных задач. В трудоёмких задачах роботы могут заменить людей, выполняя повторяющиеся и физически сложные работы, такие как сварка, покраска и работа на сборочном конвейере.
В когнитивных задачах или задачах, основанных на знаниях, роботы могут обеспечивать поддержку принятия решений путём анализа больших наборов данных, например, в медицинской диагностике или финансовом прогнозировании. Кроме того, роботы могут оказывать помощь в опасных условиях, таких как глубоководные исследования или атомные электростанции, где люди могут подвергаться риску.