Разборы

ИИ (нейросети) и картинки: как это работает и что будет дальше

Нейросети и картинки

Искусственный интеллект — не просто развлечение. Его можно применять с пользой, например, чтобы не тратиться на дорогостоящих специалистов, создавать интересные картинки, придумывать оригинальные логотипы для бизнеса. Пообщались с дизайнерами и разобрались:

Зачем бизнесу ИИ для генерации картинок

Как обучаются нейросети

В чем недостатки генерации изображений с помощью искусственного интеллекта

Какие нейросети можно использовать для создания дизайна

Зачем бизнесу ИИ для генерации картинок

Есть несколько преимуществ, поговорим о каждом.

Без проблем получать желаемое

Нейросети полезны для генерации изображений. Для этого достаточно прописать программе ключевые слова — на их основе она создаст картинку. Это удобно, если в реальности такую картинку делать сложно или невозможно. Например, нарисовать или сфотографировать корову на верхом на самолете трудно, а ИИ справится с этим за несколько секунд.

pic

Не знаю, кому понадобится такая фотография, но выглядит реалистично. Источник

Создавать неограниченное количество изображений

Перед тем, как показать картинку выше, я генерировал изображение около 15 раз. И каждый — бесплатно. Если нанимать дизайнера или художника, придется сначала заплатить за основную работу, а потом доплачивать за возможные доработки.

Плюс ИИ не только в экономии денег, но и большом количестве оригинальных иллюстраций, которые принадлежат создателю.

Получать вдохновение

Нейросети могут быть полезны для дизайнеров. Иногда сложно представить в голове, каким должен быть финальный креатив. В этом случае можно сгенерировать несколько изображений, а потом на их основе создать что-то свое, более детализированное. К вдохновению можно отнести обложку журнала Cosmopolitan от июня 2022 года, которую полностью сгенерировал искусственный интеллект.

pic

Обложка журнала Cosmopolitan. Июнь 2022. Источник

Карина Король
Карина Король

дизайнер в WIM.Agency

Благодаря сервисам по генерации изображений можно получить большое количество разного контента, на основе которого дизайнер уже создаст свой уникальный продукт.

Визуализировать дизайн

Этот вариант скорее подходит обычным людям, а не дизайнерам интерьера. Например, с помощью ИИ можно проверять свои идеи для ремонта, играть с цветовыми решениями, формами и светом.

Делать рекламу

Дисклеймер: пока что нейросетям предстоит еще развиваться, чтобы делать полноценную рекламу. Но кейсы уже появляются. Недавно в блоге Rehab опубликовали двухминутный рекламный видеоролик, полностью сгенерированный нейросетью. Текст для него создали в GPT-3, изображения — в Midjourney, а звуковое оформление — в Soundraw.

В работе дизайнера почти всегда время — ключевой фактор, а ИИ как раз помогает его сэкономить. Программа в несколько кликов может найти огромный объем информации, который будет задействован в дизайне: изображения, формы, шрифты, колористика и многое другое.

Карина Король
Карина Король

дизайнер в WIM.Agency

Компании могут использовать искусственный интеллект вместо дизайнера для экономии времени и ресурсов. Правда, только под определенные типы задач, где нет эмоциональной составляющей — ведь у ИИ нет морально-этических и культурных норм. Робот не может уловить определенные ощущения, передаваемые через дизайн.

Оптимизировать изображения

Искусственный интеллект может не только генерировать новые изображения, но и исправлять старые. Нейросети могут быть полезны для улучшения качества фото. Через разные AI инструменты можно уменьшать размер картинки до нужного веса, обрезать ее или подгонять по размеру для ПК и смартфона, или, например, убирать шумы с фотографий. Некоторые роботы умеют превращать ч/б фото и видео в цветные.

Такая функция полезна компаниям, в которых публикуется много контента с визуальной составляющей. Например, для новостных агентств или редакций.

Пример материала — статья на BBC с демонстрацией окрашивания видео с Первой мировой войны.

Наталья Чайкина
Наталья Чайкина

дизайнер в WIM.Agency

Компании могут использовать искусственный интеллект, например, для обтравки простых изображений на несложном фоне или подбора подходящего оттенка цвета — это существенно сэкономит время и ресурсы.

Но и тут есть свои нюансы: ИИ справляется с контрастным фоном, но не различает близкие оттенки цвета, часто не совсем корректно работает с волосами.

Как обучаются нейросети (коротко)

Нейросеть — это программа, которая отличается от обычных тем, что способна обучаться самостоятельно. Но для этого ее все равно нужно дорабатывать и совершенствовать.

А дорабатывают и совершенствуют нейросети в том числе и обычные пользователи. Когда они загружают свои картинки и детально описывают, что на них изображено, ИИ это запоминает — и в будущем сумеет находить похожие фрагменты по ключевым словам.

Подробнее о том, как работает нейросеть, рассказали в DALL-E — это один из сервисов, который генерирует изображения с помощью искусственного интеллекта.

Изначально в базу нейросети загружаются миллионы фотографий с коалами и миллионы фотографий с мотоциклами. Из фото с коалами нейросеть запоминает, как выглядит коала, какую позу обычно занимает. А по фотографиям с мотоциклами ИИ узнает, как выглядит транспорт и как на нем правильно сидеть. 

pic
Две разные базы фотографий внутри ИИ: одна — с коалами, другая — с мотоциклами

И при запросе «коала едет на мотоцикле» нейросеть объединит все полученные данные и создаст множество вариантов картинок, из которых можно выбрать подходящую.

pic
Базы объединяются, и нейросеть генерирует изображение

В чем недостатки генерации изображений с помощью искусственного интеллекта

Недостатков немного, но они существенные, и могут оттолкнуть от желания поработать с ИИ.

Плохо справляются с созданием людей

Дело в том, что долгое время в нейросетях нельзя было генерировать лица людей, чтобы в сети не распространялись дипфейки или другие поддельные фотографии, вводящие в заблуждение. Поэтому сейчас с генерацией лиц нейросети справляются плохо, особенно бесплатные сервисы. Лица получаются жуткими и размазанными. И такая проблема не только с «реальными» фотографиями, но и с векторной графикой.

pic
Так нейросеть сгенерировала девушек, которых не существует в реальности
pic
А так — официанта

Хотя и эта проблема решаема. Например, нейросеть StyleGAN научилась создавать реалистичные портреты — так, будто это фото реальных людей. Есть сайт-фотосток, где можно позаимствовать ее работы. StyleGAN обучалась на реальных фото из icons8.

Распространяет материалы 18+

К сожалению, если ввести определенные ключевые слова, робот может сгенерировать обнаженку или другой эротический контент. Например, недавно в приложении-фоторедакторе Lensa люди смогли создать фото реальных обнаженных людей без их согласия, рассказывает TechCrunch.

Издание провело эксперимент с помощью двух наборов по 15 фотографий. В один из наборов исследователи добавили 5 фотографий знаменитости лицом, прифотошопленным к обнаженным телам моделей. Результат — получилось сделать реалистичные обнаженные фотографии. 

Продвинутые сервисы по генерации картинок недоступны большинству компаний

Бесплатные сервисы хоть и крутые, но сделать в них такую же картину, как у Cosmopolitan вряд ли получится. Поэтому крупные компании вроде The New York Times разрабатывают собственные AI инструменты и привлекают для этого целую команду дата-инженеров.

Небольшая компания вряд ли сможет себе такое позволить, потому что зарплаты AI-программистов стартуют от 250 000 рублей и выше.

В целом мне непонятна позиция компаний, которые полностью полагаются на искусственный интеллект в своих проектах. Все же для меня ИИ — это машина, которая может выдавать только то, что найдет внутри своей системы. Либо она сделает картинку на основе того, что в нее добавит сам человек. 

В этом и разница: у человека есть широкий масштаб визуализации, творческого развития и огромные возможности при желании, а у ИИ — только набор функций.

Есть и очевидные минусы:

Не всегда получается найти то, что нужно. Фактически мы можем попросить ИИ создать определенную картинку, которая есть в нашей голове — а он не справится с задачей.

Наложение авторских прав на сгенерированные картинки. Иногда после того, как ИИ генерирует изображение — сразу накладывает на него авторские права. Поэтому использовать его без упоминания нельзя сервиса нельзя.

Наличие мелких недостатков по типу сложности поиска и подборки нужного формата подачи изображения или выдача одного контента за другой.

Карина Король
Карина Король

дизайнер в WIM.Agency

Основной недостаток ИИ для дизайнера — невозможность полной передачи дел в руки машины с сохранением зп. А если серьезно, то искусственный интеллект не всегда может точно уловить твой запрос и подстроиться под изменения контекста.

И в целом говорить о какой-то существенной пользе таких сервисов пока рано, потому что интеллект машины и человека существенно отличаются. И есть большая вероятность, что запрос от клиента вроде «Добавьте немного праздника!» так и останется неудовлетворенным.

Наталья Чайкина
Наталья Чайкина

дизайнер в WIM.Agency

На том уровне, на каком сейчас находятся сервисы генераций изображений, скорее, пока никакой пользы. Чтобы получить приемлемый результат, надо потратить кучу времени и сил. Возможно, в будущем такой темп развития ИИ может привести к потере работы для многих дизайнеров и иллюстраторов.

В целом мое мнение такое: ИИ не создаст логотип, не нарисует индивидуальный дизайн, не отретуширует профессионально фото — это и есть недостатки нейросетей на текущий момент.

Самое важное о нейронках обсудили, теперь остается попробовать несколько популярных бесплатных сервисов. И посмотреть, что в итоге получится. Для всех картинок использовали одинаковый запрос — «dog send email». Поэтому приготовьтесь к переизбытку милоты.

Какие нейросети можно использовать для создания дизайна

Midjourney

Сайт: https://www.midjourney.com/

Midjourney — один из самых популярных сервисов для генерации картинок в 2022 году. Создание картинки происходит как во всех сервисах из подборки: прописываете, что хотите получить, а нейросеть это генерирует.

Фишка Midjourney — в доступности, ведь она работает через чат в Discord. Для начала нужно перейти на официальный сайт, затем кликнуть на «Join the beta» и перейти в их сервер. Дальше войти в один из чатов с названием Newbies. Там вам дадут 25 бесплатных минут для генерации контента. За это время получится запросить 20–25 картинок.

Перед тем, как работать, зайдите в раздел #getting started и ознакомьтесь с правилами работы сервиса.

pic

Такую собаку мы получили в нейросети Midjourney. Источник

За одну генерацию ИИ выдает 4 картинки. После этого нейросеть можно подталкивать в нужном направлении, для улучшения понравившихся изображений. Чтобы доработать детали, выбирайте U1, U2, U3 и U4. Цифра здесь — порядковый номер картинки. Команда с буквой U обработает фото, увеличит его в размере и добавит несколько мелких деталей. В общем, сделает фото более «обычным».

Другой тип команды — V1, V2, V3, V4, которая позволяет сделать еще 4 варианта на основе понравившегося изображения.

Если 25 минут вам будет недостаточно, можете перейти на платные тарифы, которые стартуют от 10 долларов в месяц.

Dream

Сайт: https://dream.ai/ 

Это нейросеть от канадской студии Wombo, которая умеет генерировать изображения по заданным ключевым словам в разной стилистике. Например, можно создать изображение реалистичным, в стиле ретро-футуризма, мемов, стрит-арта, психоделики и так далее. 

Для этого нужно просто ввести ключевые слова и выбрать один из форматов.

Сервис работает в браузере, на Android и iOS устройствах.

pic

Возможности dream.ai по генерации собак и писем. Источник

Такой вариант получился, но перед этим пришлось генерировать картинку около 10 раз. При этом каждый раз собака становилась все лучше, и сама концепция больше соответствовала ключевым словам.

Сервис полностью бесплатный, можно создавать столько картинок, сколько хочется. Есть и платные услуги — печать нарисованной картины.

Dreamstudio

Сайт: https://beta.dreamstudio.ai/dream 

Это сервис на основе другой нейросети — Stable Diffusion, которую разрабатывали ученые из Великобритании и Калифорнии. 

Интерфейс сервиса развернут в отдельном сайте, хотя раньше работал только в Discord. Преимущество Dreamstudio — можно увеличить высоту и ширину изображения, а также степень: на сколько сильно картинка должна соответствовать вашему запросу.

pic

А такую картинку выдала Dreamstudio. Источник

Сервис условно-бесплатный, всем новичкам выдают внутреннюю валюту — 200 кредитов. Одно изображение стоит от 0,2 кредитов и больше. Когда кредиты закончатся, можно их докупить по 10 долларов за 1 000 кредитов.

Crayion

Сайт: https://www.craiyon.com/ 

Crayion — нейросеть, которая работает на движке DALL-E. Это мини-версия другого искусственного интеллекта — DALL-E 2.

pic

Изображение — работа движка DALL-E2. Источник

К полной версии ИИ допускают только бизнес и после предварительного отбора, а вот с Crayion может побаловаться любой. Здесь нет особенностей в функционале и гибких настроек. За одну генерацию вы получите 6 картинок, иногда очень хорошего качества.

pic

Возможности движка DALL-E mini. Источник

Сервис полностью бесплатный, но есть платная функция — печать сгенерированного изображения на футболке. Ее цена — 25 долларов.

ruDALL-E Kandinsky

Сайт: https://rudalle.ru/kandinsky 

ruDALL-E — мультимодальная нейросеть. Ее разработали в SberDevices, поэтому она умеет генерировать изображения по заданному русскоязычному описанию. Это самый большой нейросетевой и вычислительный проект в России и СНГ.

Минус ruDALL-E — медленная генерация изображений, около 2-10 минут. При этом иногда выбивает ошибки и нужно описывать изображение заново.

pic

А это — вариант собаки с письмом от ruDALL-E. Источник

Сервисом можно пользоваться через приложение «Салют» — другой продукт SberDevices. Для этого нужно открыть приложение, сказать «включи художника» и навести камеру на QR-код, который выдается при запуске генерации.

На сайте обещают, что это ускорит процесс создания и сделает картинку более качественной.

Сервис полностью бесплатный и позволяет генерировать неограниченное количество изображений. Но все сгенерированные картинки автоматически попадают под авторское право ПАО Сбербанка.