Человек всегда воспринимал технику с недоверием. Вспомнить хотя бы архетипический миф о Прометее: передача людям огня (а в расширительной интерпретации — возможность создавать технологии) оценивалась автором трагедии как вселенская катастрофа. Или протесты луддитов против внедрения машин, прокатившиеся по Англии в первой трети XIX века и ставшие реакцией на первую промышленную революцию.
Наше время не стало исключением. Как показывают многочисленные опросы, особенную тревогу вызывают технологии, которые связаны со слабым искусственным интеллектом (ИИ). Страх, что совершенствующиеся нейросети могут отобрать у людей рабочие места, занимает сегодня одно из центральных мест в дискуссиях о пределах и рисках технологического развития, отмечает жкрналист, эксперт Центра ПРИСП Тихон Сысоев.Впрочем, согласно недавнему исследованию «Задачи, автоматизация, и рост неравенства в оплате труда в США», проведенному учеными американской организации National Bureau of Economic Research, автоматизация стала главной причиной растущего экономического неравенства в США в последние 40 лет.
В отчете утверждается, что от 50 до 70% изменений в доходах американцев с 1980 года объясняются снижением заработной платы рабочих, специализирующихся на рутинных задачах в отраслях, которые пережили самую стремительную автоматизацию. «Реальные заработки мужчин без высшего образования сейчас на 15% ниже, чем в 1980 году», — заключается в статье.
Согласно другому исследованию, проведенному PwC, технологии ИИ увеличат мировой ВВП на 15 трлн долларов к 2030 году, однако уже в ближайшие годы могут оставить без работы порядка 3% работников. А к середине 2030-х эта доля может вырасти до астрономических 30–44%.
Интересно, что, если судить по характеру развиваемых технологий, этот тренд может коснуться огромного сектора креативной и сервисной экономики, который до этого абсорбировал тех, кто потерял работу в традиционных отраслях. Эксперты, в частности, предполагают, что в прошлом могут остаться такие профессии, как копирайтер, новостник, редактор, SMM-специалист, дизайнер, модератор. А наиболее радикальные технооптимисты считают, что значительные потрясения могут прокатиться и по IT-рынку.
Как заметил в одном подкасте Джек Дорси, бывший CEO Twitter, «многие цели машинного обучения и глубокого обучения сводятся к тому, чтобы со временем написать само программное обеспечение, поэтому многие задания по программированию начального уровня просто больше не будут актуальны».
Если принять все эти рассуждения всерьез, то в долгосрочной перспективе последствия такой интеграции технологий ИИ в рынок труда могут быть драматическими, учитывая, что каждая технологическая революция неизменно запускала за собой революцию социальную.
Но так ли уж все пессимистично?
Изображение за секундуДействительно, если посмотреть на то, как современные нейросети учатся выдавать все более человекоподобный материал и какой гигантский объем инвестиций этот рынок проглатывает, то все представленные выше прогнозы перестают звучать футуристично.
Согласно данным Crunchbase, финансирование стартапов в области ИИ в последние годы составляет от 9 до 10% мирового венчурного капитала. Если в 2013 году привлеченные инвестиции в такие проекты составили порядка 3 млрд долларов, то в 2021-м этот показатель добрался до отметки 69 млрд долларов. За восемь лет инвестиции выросли в 23 раза.
В том числе это привело к стремительному количественному и качественному росту нейросетей, ориентированных на разные задачи и процессы. Например, сегодня существуют приложения, которые способны быстро генерировать изображение в соответствии с подсказками пользователей всего за несколько секунд, а также создавать аватарки и скрещивать картинки.
С точки зрения артистичности и детальности изображения больше всех прославилась нейросеть Midjourney, созданная на платформе мессенджера Discord (с ее помощью, собственно, была создана обложка этого номера «Эксперта»). Огромное внимание было приковано и к появлению приложения Lensa, которое генерирует автопортреты в художественном стиле, причем такого качества, что их бывает трудно отличить от работы живого художника.
Не менее впечатляющие результаты выдает инструмент instruct pix2pix, эффективно переделывающий любую картинку по заданным чекпойнтам в нужное изображение. Другая любопытная новинка, Colorize.cc, разработанная россиянином Александром Кожевиным, позволяет почти мгновенно превращать черно-белые фотографии в цветные.
А еще есть нейросети, которые помогают эффективнее настраивать процесс делового нетворкинга (Connect+ / Uniter), улучшать качество звука (Enhance Speech от Adobe) или быстро придумывать название для нового бизнеса (Namelix). И это лишь небольшая часть списка.
Шаблонизатор и собеседникНо особенно много шума наделала последняя версия чат-бота ChatGPT, выпущенная американским стартапом OpenAI в конце 2022 года. Эта языковая модель обучена на огромном массиве текстов из интернета при помощи определенной системы обучения, которая включает в себя постоянную обратную связь человека.
«Такая технология обучения известна как Reinforcement Learning from Human Feedback. Она позволила этому чат-боту стать таким “человечным” в ответах на запросы, которые вбивает пользователь, — отличным шаблонизатором, хорошо понимающим, как должны строиться тексты и ответы», — рассказывает Иван Оселедец, ведущий научный сотрудник Института AIRI и директор центра технологий ИИ Сколтеха.
По словам эксперта, суть обучения в том, что языковая модель постоянно «общается» с человеком и тот выставляет ей оценки по определенной методологии (Reward Model, также называемая моделью предпочтений), на основе которых нейросеть совершенствуется. «В случае с этим чат-ботом речь идет не об искусственной задаче предсказания следующего слова, а об оценке качества всего ответа целиком, для чего использовалось порядка 30 людей-оценщиков, ИИ-тренеров», — замечает Иван Оселедец.
ChatGPT может быть использован для создания текста и диалога, поиска ошибок в коде, анализа документов и отчетов. Еще этот чат-бот «умеет» сочинять стихи и рассказы, писать сценарии, спорить, давать прогнозы и советы. Словом, это и поисковая система нового поколения, которой по силам потеснить традиционные поисковики; и любопытный собеседник, хоть и ограниченный; и хороший помощник, способный почти мгновенно проводить анализ данных, на что, к слову, способен не каждый человек.
Неудивительно, что уже за первую неделю после релиза проект собрал больше миллиона пользователей, а к началу февраля его ежемесячная аудитория перевалила за сто миллионов человек. Таким образом, приложение стало самым быстрорастущим в истории. У того же TikTok, чтобы прилечь такую аудиторию, ушло девять месяцев.
Закажи услугу у ИИ
«Я точно лишусь работы». «Я был очень напуган, когда начал читать все эти статьи о DALL-E и Midjourney». «Я копирайтер и почти уверен, что ИИ отберет у меня работу». В ответ на шквал новостей об очередных успехах нейросетей подобные комментарии в соцсетях или заголовки в СМИ предсказуемо стали встречаться все чаще и чаще.
Некоторые компании уже успели объявить, что будут интегрировать эти технологии в свои рабочие процессы, чтобы оптимизировать расходы, в том числе на штат сотрудников. Так, известный американский онлайн-издатель BuzzFeed сообщил, что с этого года будет использовать ИИ для создания контента в коллаборации с компанией OpenAI, и заявил об увольнении 180 сотрудников.
Одна из крупнейших фриланс-бирж fiverr.com добавила специальный раздел, где можно заказать услуги, оказываемые с использованием нейросетей. На данный момент доступны три услуги: создать иллюстрации, обработать фото и получить доступ к обучению по использованию нейросетей. Цены варьируются от 15 до 150 долларов, что в целом дешевле, чем если заказывать такую работу обычному иллюстратору. И судя по большому количеству отзывов в этом разделе, подобные услуги пользуются популярностью.
Наконец, еще один пример — разработанная в Студии Артемия Лебедева нейросеть «Николай Иронов», которая может создавать логотипы с абстракциями, инициалами, геометрическими формами, шрифтовыми композициями и не только. Все что нужно — «скормить» ей бриф заказчика, после чего модель сгенерирует разные графические решения. Эта услуга стоит от 19 900 рублей. Согласно данным компании, «Николай Иронов» уже сделал логотипы для 1400 проектов.
Страх чистого листаУ нейросетей действительно много преимуществ. Во-первых, они, в отличие от людей, никогда не устают. Во-вторых, эти технологии работают удивительно быстро и постоянно наращивают свою эффективность. В-третьих, нейросети не просто ускоряют процесс работы, но могут вывести его на новый уровень, если умело ими пользоваться. Так или иначе они решают одну очень важную задачу: оптимизируют мыслительную деятельность человека.
Например, если компания хочет быстро понять, на какие проблемы чаще всего жалуются ее клиенты, то вместо многочасовой ручной работы аналитика можно получить хороший отчет всего за несколько часов. Для этого нужно будет собрать все массивы текстовых отзывов, склеить их в один текст, а затем, разбив по частям, пропустить через ChatGPT, спросив: «С какими 20 ключевыми проблемами сталкиваются клиенты банка в следующем описании отзывов?» По признанию сотрудника одного банка, чат очень точно выделяет суть жалоб и грамотно их приоритезирует.
Эта языковая модель хорошо справляется и с задачами по программированию на уровне junior-разработчика. «Например, если я забыл, как выглядит кусочек кода или хочу вспомнить, как написать какую-то функцию, то могу обратиться к ChatGPT, и он выдаст мне нужную информацию. Еще можно дать ему кусок кода и попросить посмотреть, есть ли в нем ошибка. В ответ он может создать вполне правдоподобный код, хотя бывает, что допускает и небольшие неточности», — рассказывает Иван Оселедец.
Нейросети оказались очень полезны и в творческом процессе, особенно на начальных этапах, когда нужно набросать первый эскиз, черновик сценария или поэкспериментировать с разными эстетическими решениями.
«Обычно я использую нейросети еще на этапе обрисовывания идеи. Скажем, для создания презентации сразу нужны какие-то примеры, референсы, чтобы понять, какая стилистика подойдет лучше всего. Тогда я обращаюсь к нейросеткам, и они очень помогают. А моя знакомая, которая пишет сценарии, активно использует ChatGPT, чтобы набросать разные черновики. В них она часто находит интересные зернышки, какие-то смысловые “крючочки” для дальнейшей работы. Я бы сказал, что все эти инструменты нивелируют главную проблему любого творческого процесса — страх чистого листа», — рассказывает Никита Севастьянов, художник и фотограф.
Еще нейросети отлично работают как своеобразные «улучшайзеры»: они умеют быстро поправить качество звука или картинки до нужного уровня, в случае если подвела техника, человек или вмешалась природа.
«Мне неоднократно приходилось сталкиваться с браком на съемках. Часто приходится пользоваться не самым лучшим оборудованием, бывает, что у него недостаточное разрешение либо на записи много шумов. Но есть нейросетки, которые позволяют быстро вернуть качество или стабилизировать изображение. Это очень удобно», — замечает Никита Севастьянов.
Может ли ИИ «впечатлить»?Другое дело, что все опрошенные нами специалисты, активно использующие нейросети в своей работе, призывают не переоценивать эти технологии. Полностью делегировать им даже отдельные этапы работы сейчас не получится: за качество итогового продукта — будь то программный код, статья или изображение — все равно будет отвечать человек.
«Чтобы создать классное изображение, мем или афишу при помощи нейросеток, нужен человек с хорошим бэкграундом, например художник или дизайнер. Если ты хорошо не владеешь визуальным языком, если у тебя нет насмотренности, то сразу прыгнуть в нейросети и надеяться стать конкурентным на этом рынке нет никакого смысла. Все по-настоящему крутые кейсы с изображениями, которые создали нейросети, стали такими потому, что внутри этого процесса сидел очень опытный автор», — рассказывает Валерия Титова, нейрохудожница, автор телеграм-канала «Эй Ай Лера».
Простой пример: любое хорошее дизайн-решение учитывает три фактора — Usability (удобство использования), Impression (впечатление) и Identity (айдентика, или соответствие некоторому индивидуальному стилю). В теории нейросети могут учесть фактор Usability при генерации дизайна, но вот «впечатлить» они не могут априори, поскольку такого рода решения не алгоритмизируются. По крайней мере, пока.
Если прибегнуть к понятийному аппарату Канта, то любое программное обеспечение просто неспособно на эстетические суждения — для этого требуется живой, непосредственный опыт. В этом смысле нейросети не принимают никаких решений самостоятельно: основной замысел, все ходы и их очередность, наконец, подбор инструментов — все это находится в зоне ответственности человека.
«Люди, которые лениво пользуются нейросетями, не понимают, что, если ты ей мало дашь, она тебе столь же мало даст в ответ. Поэтому картинки, которые создают непрофессионалы, плюс-минус выглядят одинаково. Нужно потратить много времени и усилий, чтобы хотя бы научиться пользоваться этими инструментами. Теперь это, по сути, отдельная полноценная компетенция», — резюмирует Валерия Титова.
Автоматизированная посредственностьСтоль же ограничены возможности ChatGPT в области программирования. По словам, Александра Кутузова, технического директора Flipper Devices, его команда использует Github Copilot (версия GPT3, на которой основан ChatGPT со специализацией под код и разработку) для создания небольших описаний, чтобы Copilot сам сгенерировал стандартную функцию, которая раньше уже была написана другими программистами. Но даже в этих случая Copilot может делать ошибки, поэтому все результаты важно постоянно отслеживать.
«Стоит помнить, что при создании нейросетей мы пытаемся скопировать то, что увидели в природе. Но в природе нейрон не так уж просто устроен. Он не только встроен в систему связей, но еще и подвержен работе нейромедиаторов, а также существует во множестве связей между разными блоками. Поэтому, когда мы говорим о чистом программировании, о системной разработке, где нужно думать, выходить за контекст кода, смотреть в реальный мир, то здесь нейросеть даже с самыми мощными вычислительными мощностями не справится», — уверен Александр Кутузов.
Более того, работа нейросетей выстроена таким образом, что всегда будет выдавать некий усредненный, схематичный, шаблонизированный результат. «Представьте, что вы пришли в книжный магазин и купили книжку “Пять шагов, чтобы написать голливудский сценарий”. Если вы будет строго следовать ее инструкции, у вас, конечно, получится написать сценарий, но это будет всего лишь некий шаблон, у которого вряд будет какая-то ценность. То же самое с нейросетями: они очень упростили и ускорили процесс создания посредственности, но не более того», — считает Никита Севастьянов.
Это, к слову, «признает» и сам ChatGPT. Когда мы спросили у него: «В каком случае такой чат-бот, как ты, напишет статью лучше, чем профессиональный журналист?», — он ответил, что лучше всего подходит для написания статей в тех случаях, когда нужно быстро нагенерить много контента, сделать отчетность на основе данных или для статей, которые предполагают стандартизированный формат, например для описания продуктов или создания спортивных отчетов.
«Однако важно отметить, что, хотя чат-боты могут быть полезны в определенных ситуациях, они не обладают творческим потенциалом, человеческим пониманием и редакционными суждениями профессиональных журналистов и не могут создавать высококачественный контент, требующий участия человека», — грустно «подытожил» чат-бот.
Но главное препятствие, которое лежит на пути победоносного вторжения ИИ в сферу человеческого труда, связано с тем, что эти технологии пока неспособны создавать что-то абсолютно новое.
«Так как я занимаюсь математикой, для меня ясно, что главная, фундаментальная проблема, которую человечеству еще предстоит решить, — создать нейросеть, способную выдавать абсолютно новую идею, а не очередной симбиоз из того, что ей скормили. Обучить этому языковую модель — существенно более сложная задача, на мой взгляд, чем те, что мы решаем сейчас», — считает Иван Оселедец.
Как подготовиться к будущемуТем не менее все это не означает, что на нейросети можно махнуть рукой. Да, в обозримой перспективе они не «выключат» человека из процесса интеллектуального труда, очень скоро они, очевидно, внесут в него огромные изменения, к которым придется адаптироваться. В первую очередь готовиться нужно будет низкоквалифицированным игрокам креативной индустрии, которым придется быстро осваивать новые стандарты работы, чтобы выдержать конкуренцию.
Более того, как напоминает Александр Чулок, международный эксперт Программы развития ООН по форсайту, директор Центра научно-технологического прогнозирования Института статистических исследований и экономики знаний НИУ ВШЭ, у технологий есть свойство распространяться экспоненциально: они нелинейно проникают в нашу жизнь.
«То, что сегодня кажется чем-то экстраординарным, завтра уже может стать новой нормой. Скажем, нельзя исключать, что уже через несколько лет фермеры по всему миру будут постоянно консультироваться у ChatGPT по поводу того, как и чем удобрять почвы, и, соответственно, более эффективно создавать свой продукт», — замечает Александр Чулок.
Как известно, «закон Мура для сверхпроводников» (хотя корректнее было бы говорить не о «законе», а об «эмпирическом наблюдении») гласит, что «количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые 24 месяца».
Показательный пример — стремительное удешевление вычислительной мощности. Если в 1992 году миллион транзисторов стоил 222 доллара, то в 2012 году — уже 0,06 долларов. Эта кривая снижения затрат и производительности, в частности, позволила так эффективно использовать вычислительные мощности для цифровой инфраструктуры.
Собственно, все опасения относительно нейросетей обусловлены этим трендом: никто не может предсказать, на что эти технологии будут способны через пять, десять, двадцать лет и как на них может отреагировать бизнес, который всегда ищет способы оптимизировать свои затраты.
Отсюда бесконечные дискуссии о безусловном базовом доходе и в целом активизация всего левого политического фланга, разнообразные программы дополнительного образования и повышения квалификации, тренинги по личностному росту. По замыслу, вся эта машина должна быть направлена на то, чтобы смягчить потенциальные риски очередной глобальной пертурбации на рынке труда.
Другое дело, что большинство исследователей все еще считают, что в будущем нас ждет не вытеснение человеческого труда технологиями ИИ, а их конвергенция.
«Мы видим, что эти технологии, скорее, будут способствовать повышению качества и эффективности человеческого труда, но людям, безусловно, уже сейчас нужно готовиться к новой реальности. Я лично считаю, что учиться пользоваться нейросетями нужно уже со школы, поскольку этот навык станет таким же базовым, как счет, чтение и письмо», — уверен Александр Чулок.
Гонка продолжается
Между тем технологическая гонка между ведущими IT-гигантами, похоже, набирает новые обороты. Свою версию чат-бота уже успел обнародовать Google. Она называется Google's LaMDA и, как заверяют в компании, обгоняет прошлую версию по числу параметров в три раза: теперь у нее их 540 млрд.
О создании аналога ChatGPT заявили в «Яндексе». Новая нейросеть YaLM 2.0 будет интегрирована в сервисы компании к концу 2023 года, как пообещали в корпорации. К слову, на основе первой версии YaLM работала «Балабоба» — нейросетевой сервис генерации текстов, а также «Алиса».
Присоединиться к гонке хочет и крупнейший китайский поисковик Baidu. В планах компании — уже в марте запустить собственный чат-бот на базе ИИ, интегрировав его в свой поисковик.
Наконец, продолжит совершенствовать свою языковую модель OpenAI. корпорация Microsoft, которая частично владеет стартапом с 2019 года, готовится вложить в нее еще 10 млрд долларов, а взамен сможет получать 75% прибыли разработчика технологий на основе машинного обучения. При этом сам ChatGPT Microsoft хочет интегрировать в софт Office.
Поисковик Microsoft Bing в скором времени тоже должен стать «умнее»: по запросу он будет давать не ссылки, а уже готовые ответы.
Ранее опубликовано на: https://expert.ru/expert/2023/08/vyzov-nechelovecheskoy-kreativnosti/
Печать