Гайды

Гид по Kandinsky: как использовать нейросеть для создания картинок

Подбираем изображения для постов и генерим стикерпак
Как генерировать картинки в нейросетке Kandinsky

Есть много нейросетей для создания изображений — но не каждая может понять запрос на русском языке. Kandinsky от Сбера поможет, если не хочется долго формулировать промпты на английском. В сервисе можно сгенерировать аналоги известных картин, реалистичные изображения, анимацию или стикерпак для Telegram. Весь функционал доступен бесплатно. 

В статье пошагово разберем, как работать в версии 3.1 — на июль 2024 года она поддерживает детализированную генерацию с нуля и доработку готовых изображений, видео или гифок. 

Где доступна нейросеть

Использовать Kandinsky 3.1 можно бесплатно через сайт и ботов. Разница в функциях каждой платформы.

Сайт Fusion Brain. Здесь доступно больше всего инструментов. Можно генерировать и дорабатывать картинки в разных стилях и размерах, создавать видео, гифки. Сервис просит предварительную регистрацию.

Telegram-бот Kandinsky. Можно создать картинку с нуля или перенести стиль с одного изображения на другое. Есть отдельная функция для стикеров, но нет генерации видео.

Протестировать нейросеть можно и в других сервисах, например в чате внутри мессенджера ВКонтакте или в приложении «Салют» от Сбера. Но там сильно урезан функционал — можно ввести только один текстовый промпт. Поэтому для генерации в рабочих целях лучше выбрать сайт или бота в Telegram. 

Как пользоваться

Из разделов сайта Fusion Brain мы рассмотрим вкладки «Картинки» и «Видео». Аналогичные настройки можно найти и в Telegram-боте — в формате чата с кнопками:

Промпт и негативный промпт. Это текст, по которому генерируется изображение. В одном поле нужно указать то, что должно быть на картинке. Например, описать локацию, героев или предметы «в кадре», ракурс, атмосферу. А в другом — то, чего следует избегать. 

Об общих правилах общения с нейросетями можно почитать в нашем гайде по промптам. Разработчики Kandinsky советуют делать запрос как можно более детальным. Но по нашему опыту, если указать слишком много слов, нейросеть начинает путаться и пропускает часть текста.

Поле для промпта в нейросети Кандинский
Если идей нет, нейросеть поможет — нужно нажать на волшебную палочку в поле ввода текста и получить контекст или детали

Стиль. Это общий дизайн работы — уникальный или копирующий великих мастеров. Можно выбрать один из 18 вариантов, в том числе аниме, 3D-рендер, масляная живопись или пиксель-арт. Разработчики периодически добавляют новые дизайны и убирают неактуальные — так было с «Новым Годом». К каждому стилю есть готовый пример с котиком.   

Стили в нейросети Кандинский
Благодаря этой функции стили не нужно каждый раз прописывать в промпте

Кадрирование. Можно выбрать квадрат, прямоугольник с соотношением 9:16 или 16:9, 2:3 и 3:2. Стандартный размер по одной из сторон будет 1024 пикселя. Для постов подойдет 1:1, а для рекламных баннеров — остальные варианты. 

Область генерации в нейросети Кандинский

Направление камеры. На вкладке «Видео» в режиме анимации можно выбрать поворот для каждой сцены. Варианты отображаются в виде эмодзи с луной и стрелок, а при наведении появляется референс — тигр в пиджаке. В режиме видео такой функции нет — только ввод промпта. 

Направление камеры в нейросети Кандинский
На анимацию из трех сцен уйдет примерно 4,5 минуты

Что можно сгенерить в Kandinsky

Нейросеть подойдет для решения разных маркетинговых задач. Сгенерированные изображения можно запускать в рекламу, использовать в оформлении блога или карточек товаров на маркетплейсах. Можно попытаться пробить «баннерную слепоту» зрителя — как раз с помощью свежего взгляда от нейросети.

Нужно попробовать несколько вариантов промптов и ракурсов, так как Kandinsky не понимает, где границы создаваемого объекта, а где фон.

Контент на свой ресурс

Нейросеть можно использовать, чтобы создать единый стиль для визуального контента в канал, блог, презентацию или бренд-медиа. А еще для обложки и иллюстраций внутри книги. Для этого нужно выбрать соответствующий стиль в десктоп-версии и создавать в нем все изображения. 

Представим, что мы запустили блог о растениях — рассказываем, какого друга купить домой и как выращивать цветы на продажу. Аудитория — начинающие, возрастом от 25 лет. В каждой статье или посту можно сделать картинку в стиле Малевича, киберпанк или пиксель-арт.

Здесь и далее будем указывать промпт в подписях к изображениям.

Успешная генерация в нейросети в стилях пиксель-арт, киберпанк, малевич
Горшок с цветком розой стоит на столе, рядом телескоп и глобус

Рекламный баннер или карточки товаров

Фишка Kandinsky — детальные и гиперреалистичные изображения. Нейросеть может создать «фотографию», которую останется только доработать самостоятельно или с помощью дизайнера. 

Например, мы продаем настольные светильники ручной работы. Чтобы не заказывать фотосессию, можно сгенерить фото (без стиля) и заменить принт на товаре на свой. Лучше сразу выбирать формат 16:9, а потом по необходимости кадрировать его уже вне сервиса. 

Успешная генерация баннера в нейросети Кандинский
Настольный светильник ручной работы в интерьере спальни, средний план

В работе через Telegram-бота можно «смешивать» несколько картинок в одной. Функция пригодится, если нужно разнообразить старые кадры или внести детали, которые не получилось создать в реальности. 

Представим, что мы провели фотосессию для рекламы пижам. А затем решили доработать ее — изменить атмосферу фото и образ модели, добавив горный пейзаж. Для этого попросим оставить 70% от исходного кадра и 30% от того, по которому будем изменять. В результате у одежды девушки как будто появился блеск. При варианте 50/50 она уже отправилась в «путешествие» — изменился ракурс, фон и акценты.

Успешное смешение стилей в нейросети Кандинский
Фото девушки и пейзаж с сайта Unsplash

Создать сторис

В нейросети можно создать основу, а потом добавить текст в Figma или Photoshop. По формату лучше сразу выбрать вертикальную картинку — так все детали будут в кадре. 

Например, нам нужна рекламы курьерской службы. Для решения задачи мы хотим сгенерить картинки, чтобы привлечь молодежь к трудоустройству у нас и работе на своем транспорте. Нам может подойти стиль аниме. 

Успешная генерация сторис в нейросети Кандинский
Курьер на велосипеде, едет в новом ЖК, двор с цветами, на спине большой квадратный рюкзак оранжевого цвета

Динамичный кадр привлечет больше внимания к рекламе. Поэтому можно не ограничиваться статичной картинкой. В Kandinsky — одна из нейросетей, которые умеют оживлять изображения.

Видео. Подойдет для создания бесшовного и однородного ролика, как будто нарисованного иллюстратором.

Анимацию. Включает больше возможностей для поворота объекта, приближения и отдаления камеры. Но проигрывает в однородности — каждую сцену нейросеть отрисовывает заново, поэтому детали могут изменяться до неузнаваемости.

Успешная генерация анимации в нейросети Кандинский
Оранжевый грузовик едет на дороге. Снято в стиле аниме, динамичный

Стикерпак

Можно сгенерировать стикерпак, чтобы публиковать его в канале и повышать вовлеченность аудитории. Для этого в Telegram-боте Kandinsky есть специальный режим — он по умолчанию создает работы только в мультяшном стиле и без фона. 

Представим, что нужно создать стикеры с маскотом бренда — например, енотом. Тогда мы можем указать, что он делает и что его окружает. Например: «Енот ест мороженое». Лучше обходиться без надписей, детализации и сложных ракурсов. После каждой генерации стикер можно добавить в новый или существующий пак. 

Успешная генерация стикерпака в нейросети Кандинский
Енот улыбается, на нем ободок с цветами. Вокруг енота сердечки

Личные задачи

Kandinsky не обязательно использовать только для маркетинговых задач — в нем можно сгенерировать аватарку или открытку. Для этого хорошо подойдет тот же пиксельный стиль или рисунок карандашом, масляная живопись, хохлома. 

Успешная генерация в стилях хохлома, пикассо
Горшок с цветком розой стоит на столе, рядом телескоп и глобус

Ретушь

Нейросеть подходит не только для генерации уникального изображения, но и для доработки фотографий или иллюстраций. В этом помогают инструменты — «Область генерации» и «Ластик».

Область генерации. Если создать картинку по промпту, а потом передвинуть рамку — можно доработать изображение. Мы сначала выбрали пустой луг, а затем добавили на него пчел. 

Важно учесть, что Kandinsky дорисовывает картинку четко по области генерации. Мы специально сдвинули ее чуть ниже границы исходного изображения — в итоге новое съехало. 

Прием хорошо работает с созданными в сервисе картинками — их можно органично детализировать в том же стиле. А вот при загрузке фотографии Kandinsky адекватно дорисовывает только фон и продляет уже существующие объекты. 

Мы взяли фото с чайкой и решили расположить ее левее. Для этого выбрали в редакторе новую область, которая выходит за рамки кадра.

Область генерации для фото в нейросети Кандинский
Источник фото: Unsplash

Нейросеть дорисовала облака, небо и ограждение. Но горизонт немного съехал, а на ровной водной глади появился какой-то металлический объект. В целом эти нюансы можно исправить вручную. 

Успешная доработка фото

Ластик. С ним можно стереть лишнюю деталь или «замазать» это место с помощью промпта. Мы взяли фотографию с абстрактной живописью и просто провели ластиком полоску. Затем расположили область для генерации поверх кадра и получили заполнение. 

Успешная ретушь в нейросети Кандинский
Кажется, промпт можно указать любой — оранжевые и фиолетовые мазки совсем не похожи на горный луг

С какими задачами нейросеть пока не справляется

Преимущества работы именно с Kandinsky — поддержка русского языка, простой выбор стилей, возможности для детализации и ретуши. А главное — работать над изображениями можно бесплатно и без ограничений. Но у нейросети есть и недостатки, которые могут помешать работе с ней. 

Путается в стилях

При выборе стилей «Аниме» и «Мультфильм» Kandinsky выдает идентичный результат. То же самое случается и с другими — «Цифровая живопись», «Портретное фото» и «Студийное фото». Добиться от ИИ такого же результата, как на превью 3D-рендера, которое показано в сервисе, вообще не получилось. 

Неудачная генерация в стиле 3D и цифровой портрет в нейросети Кандинский
Горшок с цветком розой стоит на столе, рядом телескоп и глобус

Проблемы возникают и при генерации в режимах «Перенос стиля», «Вариация» в Telegram-боте. Kandinsky четко выполняет задачу, только результат получается совсем сырым и не соответствующим реальности. Например, люди словно жидкость могут расплываться или превращаться в горы. 

Ошибается с промптами

Как и у других нейросетей, у Kandinsky что-то получается лучше, а что-то — совсем плохо. Поэтому он может не подойти для решения сложных задач: визуализации подробных промптов, реалистичных фотографий с реально существующими объектами. 

Например, у нас адекватно получились цветы, люди, животные. Но с предметами, механизмами, пропорциями лица или пальцами рук бывают ошибки. На одной из работ мы получили два глобуса, в другой — «планета» была вместо вазы или лежала на столе, а вместо нее на подставке оказался бутон. 

Неудачная генерация в стиле мультфильм и аниме в нейросети Кандинский
Горшок с цветком розой стоит на столе, рядом телескоп и глобус

Нейросеть понимает русский язык, но не может воспроизвести его на своих картинках. Поэтому создать с ее помощью логотип или стикерпак с фирменными фразами не получится — лучше использовать один из ИИ-сервисов в нашей подборке.

Неудачная генерация картинок с надписями в нейросети Кандинский
Надпись: «Ты сможешь!»

Кратко: кому подойдет нейросеть Kandinsky

Kandinsky — хороший вариант для новичка в нейросетях. В сервисе есть примеры стилей и специальные режимы, которые делают генерацию картинок и анимаций проще. Поэтому ИИ подходит для личных и несложных бизнесовых задач. 

А еще нейросеть оценят те, кто активно использует горячие клавиши. В этом сервисе можно перемещаться между инструментами с помощью клавиатуры:

Написать или исправить промпт /
Запустить генерацию Ctrl + Enter
Включить ластик E
Вставить изображение I
Вернуться в режим генерации G