2022 – год, когда ожидания от искусственного интеллекта наконец-то начали оправдываться

Оригинал: 2022 Was the Year AI Finally Started Living Up to Its Hype
Автор: Эдд Гент (Edd Gent)

С тех пор, как в 2012 году глубокое обучение ворвалось в мейнстрим, шумиха вокруг исследований в области искусственного интеллекта часто опережала реальность. Однако ряд прорывов и важных вех, пройденных за прошедший год, свидетельствуют о том, что эта технология, возможно, наконец-то начала оправдывать свои обещания.

Несмотря на очевидный потенциал глубокого обучения, в течение последнего десятилетия регулярные предупреждения об опасностях выпущенного на свободу сверхразума и перспективах технологической безработицы смягчались тем фактом, что большинство систем искусственного интеллекта были заняты идентификацией изображений кошек или сомнительного качества переводами с английского на китайский.

Однако за последний год произошел неоспоримый скачок в возможностях систем искусственного интеллекта в таких разнообразных областях, как креативные индустрии, фундаментальная наука и компьютерное программирование. Более того, системы искусственного интеллекта и их результаты становятся все более заметными и доступными для обычных людей.

Нигде достижения не были столь очевидны, как в развивающейся области генеративного искусственного интеллекта – зонтичного термина для множества моделей, нацеленных на решение творческих задач.

Это произошло в первую очередь благодаря модели под названием transformer, которая на самом деле была впервые представлена Google в 2017 году. Действительно, многие системы искусственного интеллекта, попавшие в заголовки газет в прошедшем году, являются обновлениями моделей, над которыми их разработчики трудились в течение некоторого времени. Но результаты, которые они получили в 2022 году, полностью затмили достижения предыдущих итераций.

Наиболее заметным среди них является ChatGPT, чат-бот с искусственным интеллектом, основанный на последней версии большой языковой модели OpenAI GPT-3. Выпущенный для широкой публики в конце ноября 2022 года, сервис поражает людей своей удивительной способностью вести естественно воспринимаемый разговор, отвечать на сложные технические вопросы и даже создавать правдоподобные прозу и поэзию.

Ранее в 2022 году другая модель OpenAI под названием DALL-E 2 покорила интернет своей способностью генерировать гиперреалистичные изображения в ответ на такие причудливые запросы, как «енот, играющий в теннис на Уимблдоне в 1990-х годах» и «Человек-паук из Древнего Рима». В сентябре 2022 года Meta сделала еще один шаг вперед с системой, которая может создавать короткие видеоклипы из текстовых подсказок, а исследователям Google даже удалось создать искусственный интеллект, который может генерировать музыку в стиле воспроизводимого аудиоклипа.

Последствия этого взрыва креативности и скорости распространения искусственного интеллекта сейчас трудно оценить, но они уже породили прогнозы того, что это может заменить традиционные поисковые системы, убить эссе в колледжах и привести к смерти искусства.

Это связано как с ростом возможностей этих моделей, так и с их растущей доступностью: такие сервисы, как ChatGPT, DALL-E 2 и генератор Midjourney, переводящий текст в изображение, открыты для всех бесплатно (по крайней мере, на данный момент). Независимая лаборатория искусственного интеллекта Stable Diffusion пошла еще дальше, открыв исходный код своего искусственного интеллекта преобразования текста в изображение, что позволяет любому, у кого есть достаточно мощный компьютер, запускать его самостоятельно.

За последний год искусственный интеллект также добился прогресса в решении более прозаических задач. В январе 2022 года Deepmind представила AlphaCode, генератор кода на базе искусственного интеллекта, который, по словам компании, в соревнованиях по кодированию может потягаться со средним программистом. В сходном проекте GitHub Copilot инструмент для кодирования искусственного интеллекта, разработанный GitHub и OpenAI, перешел от прототипа к коммерческому сервису подписки.

Еще одним важным ярким пятном стала все более заметная роль искусственного интеллекта в фундаментальной науке. В июле 2022 года компания DeepMind объявила, что ее новаторский ИИ AlphaFold предсказал структуру почти всех известных науке белков, что может привести к потенциальной революции как в естественных науках, так и в разработке лекарств. В феврале того же года компания также объявила, что обучила свой искусственный интеллект управлять бурлящей плазмой, обнаруженной внутри экспериментальных термоядерных реакторов.

И хотя искусственный интеллект, похоже, все дальше уходит от игрушечных проблем, которыми он занимался в течение последнего десятилетия, он также добился значительного прогресса в одном из основных направлений исследований искусственного интеллекта – играх.

В ноябре 2022 года Meta продемонстрировала искусственный интеллект, который вошел в топ-10 процентов игроков в настольной игре Diplomacy, которая требует сложной комбинации стратегии и переговоров на естественном языке с другими игроками. В том же месяце команда Nvidia обучила искусственный интеллект играть в сложную 3D-видеоигру Minecraft, используя только высокоуровневые инструкции на естественном языке. И в декабре того же года DeepMind справился с дьявольски сложной игрой Stratego, включающей в себя долгосрочное планирование, блеф и приличную дозу неопределенности.

В то же время не все шло гладко. Несмотря на внешне впечатляющий характер результатов генеративного ИИ, такого как ChatGPT, критики поспешили указать, что многие модели являются весьма убедительными генераторами чуши. Они обучены на огромном количестве текстов различного качества из интернета. И в конечном счете все, что они делают, это угадывают, какой текст, скорее всего, появится после запроса, не имея возможности судить о правдивости их вывода. Это вызвало опасения, что интернет вскоре может быть наводнен огромным количеством убедительно выглядящей чепухи.

Примером этому стал запуск ИИ-портала Meta’s Galactica, который должен был обобщать научные статьи, решать математические задачи и писать компьютерный код для ученых, чтобы помочь им ускорить их исследования. Проблема заключалась в том, что он создавал убедительно звучащий материал, который был совершенно неправильным или сильно предвзятым, и сервис был закрыт всего через три дня.

Предвзятость является серьезной проблемой для этого нового вида искусственного интеллекта, который обучается на обширных массивах материалов из интернета, а не на более тщательно отобранных наборах данных, которыми снабжались предыдущие модели. Аналогичные проблемы возникли и у ChatGPT, который, несмотря на фильтры, установленные OpenAI, обманом можно вынудить сказать, что только белые и азиатские мужчины становятся хорошими учеными. А популярное ИИ-приложение для создания изображений Lensa было отозвано за сексуализацию женских портретов, особенно азиатского происхождения.

В других областях искусственного интеллекта год выдался не слишком удачным. Концепция беспилотного автомобиля, один из самых разрекламированных примеров использования ИИ в реальном мире, столкнулся со значительными неудачами: закрылся поддерживаемый Ford и Volkswagen проект Argo, Tesla отбивается от обвинений в мошенничестве из-за неспособности выполнить обещания полной автономности, и все слышнее становится хор голосов, утверждающих, что эта отрасль застряла в болоте.

Несмотря на очевидный прогресс, есть и те, кто, как Гэри Маркус (Gary Marcus), говорят, что глубокое обучение достигло своих пределов, потому что оно не способно по-настоящему понять ни один из материалов, на которых оно обучается, и вместо этого просто учится устанавливать статистические связи, которые могут привести к убедительно выглядящим, но зачастую ошибочным результатам.

Но для тех, кто стоит за некоторыми из самых впечатляющих результатов этого года, 2022 год стал предзнаменованием того, что должно произойти в будущем. Многие предсказывают, что следующие большие прорывы произойдут благодаря мультимодальным моделям, которые сочетают в себе все более мощные способности во всем – от текстов до изображений и аудио. Сможет ли эта область сохранить набранный темп в 2023 году, еще предстоит выяснить, но в любом случае 2022 год, скорее всего, стал переломным моментом в развитии искусственного интеллекта.

Обсудить