Гайды

Бесплатная нейросеть Stable Diffusion: гид по работе с изображениями

Разбираем функционал онлайн-версии
Как создавать изображения в Stable Diffusion

Творчеством от искусственного интеллекта сегодня никого не удивишь. Но не каждый сервис позволяет делать картинки высокого качества, еще и в десятках разных стилей. Stable Diffusion — одна из самых продвинутых нейросетей для генерации изображений, доступная абсолютно бесплатно. Разбираемся, как работает онлайн-версия и что можно делать с ее помощью. 

Изображения от нейросети Стейбл Дифьюжн
Картинки, сгенерированные в Stable Diffusion, отличаются многообразием художественных техник

Как работает Stable Diffusion

Stable Diffusion обучена более чем на 5 миллиардах пар «изображение-текст». Разработчики заложили в сервис много дополнительных возможностей, которые дают получить более точный результат: например, менять стиль, делать рамки. Кроме того, за счет использования техники Outpainting нейросеть умеет заполнять и расширять размер изображений, добавлять новые элементы к существующей картинке. 

В основе Stable Diffusion такой принцип работы: 

  1. Запомнив картинку при обучении, нейросеть емко фиксирует происходящее на ней через простой код — как мозаику из множества мелких кусочков (это называется латентное пространство).
  2. Затем Stable Diffusion добавляет к шум, делая изображение все более расплывчатым, пока оно не превратится практически в случайный набор пикселей (это и есть диффузия). Так ИИ анализирует структуру изображения.
  3. Благодаря обучению на огромном количестве примеров, модель может из «шума» восстановить картинку. Генерируя новое изображение с нуля, нейросеть постепенно добавляет к нему детали и «отматывает» шум в обратном направлении (это обратная диффузия).

Схематично процесс генерации выглядит примерно так:

Принцип работы модели нейросети Stable Diffusion
Stable Diffusion «изучает» изображения, разбирается в их устройстве, а затем используя эти знания для генерации новых картинок

Чем онлайн-версия отличается от десктопной

Stable Diffusion работает в браузерной и в десктопной версии. Онлайн-сервис имеет ограниченный функционал. Но здесь есть все основные опции: можно задать текстовый запрос, добавить отрицательный промпт, выбрать стиль. Также можно указать количество готовых вариантов — 1-2 на бесплатном тарифе и 4 в премиум-версии. По умолчанию размер сгенерированной картинки — 512×512 px, можно изменить соотношение сторон. Бесплатные генерации хранятся в течение 7 дней.

Интерфейс онлайн-сервиса нейросети Стейбл Дифьюжн
Интерфейс онлайн-версии Stable Diffusion

Чтобы генерировать картинки бесплатно, каждый пользователь после регистрации ежедневно получает по 10 кредитов — они позволяют создать 10 изображений. При этом на картинках в углу будет стоять водяной знак. Чтобы его убрать и увеличить количество генераций до 2000 – 4000 в месяц, нужно перейти на платный тариф. Стоимость начинается от $7 в месяц. 

Тарифы Стейбл Дифьюжн
На платном тарифе изображения не содержат водяных знаков

Десктопная версия полностью бесплатная, и ее возможности шире. Можно самостоятельно задавать размер изображения, уточнять запросы, выбирать количество шагов по созданию картинки, указывать уровень четкости, работать по референсам и многое другое. Главный минус — нужны хотя бы минимальные знания программирования. Необходимо установить Python и Git, скачать и распаковать архив с программой, найти и запустить подходящую модель (возможности разных моделей отличаются). При этом для корректной работы нейросети требуется соответствие устройства определенным характеристикам. 

Windows macOS
Видеокарта NVIDIA от серии GeForce RTX 20xx Процессор M1 или M2
16+ ГБ оперативной памяти Последняя версия macOS Monterey
4 ГБ видеопамяти

Если у вас более слабый компьютер, десктопная версия может работать, но будет тормозить.

Работа идет через командную строку. Но можно использовать графический интерфейс, от Automatic1111, он доступен для Windows.

Интерфейс десктопной версии Стейбл Дифьюжн
Источник: La Vivien Post

Существуют также более простые пользовательские приложения со Stable Diffusion для macOS — CHARL-E, DiffusionBee, Roll Art Die.

Мы остановимся на онлайн-версии с официального сайта Stable Diffusion. Никаких технических характеристик компьютера или специальных знаний она не требует, достаточно просто зарегистрироваться. Возможностей сервиса будет достаточно, чтобы создавать иллюстрации для постов и баннеров, дорисовывать собственные изображения или генерировать себе референсы и эскизы для дальнейшей доработки.

Как генерировать изображения

Шаг 1. Зарегистрируйтесь на сайте и авторизуйтесь. В правом верхнем углу интерфейса можно выбрать язык и кликнуть на кнопку «Начать».

Начало работы

Шаг 2. В верхнем поле укажите текстовый запрос на английском языке. Вы можете написать промпт на русском, а затем перевести его с помощью онлайн-переводчика и вставить в поле. 

Указание промпта Stable Diffusion

Шаг 3. При необходимости, добавьте отрицательный запрос. В этом поле напишите то, чего не должно быть на изображении. Просто перечислите предметы или явления, которые нейросеть не должна использовать. Запрос также пишите на английском языке.

Добавление отрицательного запроса в Стейбл Дифьюжн

Шаг 4. Выберите стиль. Всего доступно 24 варианта, а если никакой стиль не нужен, кликайте по зачеркнутому кругу с надписью «Нет». При выборе стиля длина промпта не должна превышать 10 слов.

Выбор стиля в Стейбл Дифьюжн

Шаг 5. Укажите соотношение сторон. По умолчанию выбран вариант 1:1, что соответствует картинке размером 512×512. Но вы можете изменить соотношение от 12:5 до 5:12. 

Соотношение сторон в Stable Diffusion

Шаг 6. Выберите количество результатов. В бесплатной версии можно указать 1 или 2 варианта. Одно изображение будет стоить один кредит.

Количество изображений в Стейбл Дифьюжн

Шаг 7. Укажите расширенные настройки, если нужно. Здесь можно задать масштаб направления, он влияет на точность учета промпта. По умолчанию стоит значение 7 — оно позволяет исключить и вероятность полного несоответствия запросу, и риск слишком буквальной трактовки промпта.

Также можно использовать фиксированный сид — вести работу от некой исходной точки. При включении этой опции нейросеть будет генерировать похожие картинки по одному запросу. Если хотите получать кардинально разные изображения, просто не ставьте флажок. 

Расширенные настройки в Stable Diffusion

Шаг 8. Кликните на кнопку «Создать».

Создание картинки в Stable Diffusion

Дождитесь завершения генерации. Обработка длится менее минуты. 

Обработка запроса в Стейбл Дифьюжн

Шаг 9. Посмотрите готовые изображения. Если не получилось создать нужную картинку, попробуйте изменить промпт и отрицательный запрос. 

Готовые результаты в Стейбл Дифьюжн

Шаг 10. Скачайте понравившийся вариант. Для этого кликните на картинку. Под ней будут кнопки для скачивания, копирования или отправки результата в соцсети. 

Сохранение результата в Stable Diffusion

Самое сложное — составление правильного промпта. Важно как можно подробнее описать картинку — детали объекта, цвета, особенности предметов. Используйте короткие предложения или словосочетания, перечисляя их через запятую. Допустимая длина запроса — до 500 символов. 

В промпте для Stable Diffusion наибольший вес имеют первые слова. Поэтому важно соблюсти определенный порядок слов. Примерная схема: объект + основные характеристики объекта + окружающая среда + дополнительные детали изображения + освещение/цветовая гамма.

Если важно наличие определенной детали на картинке, соответствующую часть промпта можно написать в круглых скобках — (часть запроса). Также узнать больше хитростей о составлении промптов можно в официальном гайде сервиса

Неплохое решение — воспользоваться готовыми промптами и сервисами для их генерации. Например: 

  • База подсказок от Stable Diffusion. В поисковой строке напишите основной запрос, выберите наиболее подходящее изображение и посмотрите, какой запрос использован для ее генерации. 
  • Public Prompts. Это публичная библиотека промптов, которые отсортированы по категориям. Выберите категорию и скопируйте понравившийся запрос. 
  • PromptoMania. Здесь можно создать грамотный запрос на основе подсказок и референсов. 
  • Stable Diffusion Prompt Generator. Это сервис для улучшения промпта. Введите свой запрос и получите улучшенный вариант. э

Если хотите научиться лучше формулировать запросы для разных нейросетей, воспользуйтесь нашим руководством по составлению промптов.

Дополнительные функции

С помощью дополнительного функционала нейросети можно упростить работу с изображениями. Рассмотрим все возможности, доступные онлайн. 

Изображение в изображении. Позволяет добавлять новые объекты в ваши иллюстрации и фотографии. Загрузите картинку или перетащите файл в верхнее поле. Укажите промпт — что нужно изменить или доработать на изображении. Впишите отрицательный запрос. Укажите настройки — стиль, количество изображений, соотношений сторон — и запустите генерацию.

Инструмент отлично подойдет, если нужно видоизменить изображение, добавить какие-то детали. Эта функция расходует кредиты так же, как и генерация картинок с нуля.

Удаление фона (Background Remover). Нейросеть определяет предметы на первом плане и удаляет все лишнее. Инструмент умеет обрабатывать картинки с несколькими объектами. Функция доступна бесплатно без ограничений, кредиты не расходуются.

Удаление фона в Stable Diffusion
Для получения качественного результата выбирайте изображения с четким силуэтом объекта

Волшебный ластик (Magic Eraser). Позволяет быстро удалить лишние детали на картинке. Загрузите картинку. Затем в открывшемся редакторе выделите детали для удаления и нажмите «Стереть». На бесплатном тарифе функция доступна за кредиты. При этом нельзя обрабатывать изображения в HD-качестве. Нейросеть попросит снизить качество картинки или перейти на премиум-версию. 

Волшебный ластик в Стейбл Дифьюжн
Размер ластика можно менять и затем перетаскивать его на нужный объект

Редактировать что угодно (Edit Anything). В этом разделе пользователям доступен умный AI-редактор. С его помощью можно варьировать цветовую гамму или изменять отдельные части картинки. 

Редактировать что угодно в Stable Diffusion
Желаемое изменение нужно просто написать в командную строку в свободной форме

Кстати, запросы в данном случае можно сформулировать по-русски. Стоимость одной итерации в бесплатной версии составляет 2 кредита. Редактирование HD-изображений также доступно только на платном тарифе.

Масштабирование изображений (Image Upscaler). Можно увеличить изображение без потери качества на 200% за 2 кредита или 400% за 4 кредита. Просто загрузите картинку и кликните на кнопку «Высококлассный» (в русскоязычной версии у некоторых кнопок такие забавные названия). Бесплатно пользователь может масштабировать исходные изображения не больше 5 МБ или 1024 пикселей.

Масштабирование изображений в Стейбл Дифьюжн
Увеличение картинки нейросетью позволит избежать размытости в крупном формате

Эскиз в изображение (Sketch to Image). Эта функция позволит вам почувствовать себя художником.. В редакторе нарисуйте эскиз — это может быть просто схематичный набросок. Дополнительно можно задать фон, добавить геометрические фигуры и текст. Также можно загрузить готовый эскиз. 

Эскиз в изображение в Stable Diffusion
Эскиз помогает нейросети лучше понять задумку автора

Для получения более качественного результата добавьте подсказку и выберите стиль. Здесь также можно писать промпты на русском языке. Стоимость одной генерации в бесплатной версии равна одному кредиту. 

Смена лица онлайн (Face Swap Online). Это новая функция, реализованная на отдельной платформе. Поэтому для использования сервиса потребуется дополнительная регистрация. Инструмент позволяет заменить лицо на фото или видео. Необходимо загрузить исходный файл и добавить картинку лица, которое нужно добавить. Можно загружать групповые снимки или видео и менять в них лица. Бесплатная версия позволяет создавать 10 изображений и 3 видео в месяц. Платный тариф начинается от $7 в месяц и увеличивает количество изображений до 500+. 

Смена лица онлайн в Стейбл Дифьюжн
Потестировать инструмент смены лиц можно в демо-режиме

Stable Diffusion предоставляет широкие возможности для работы с изображениями. С ее помощью можно сгенерировать референс для мудборда или иллюстрацию для поста, быстро отретушировать фото для заставки на сайте или вырезать товар из фона для карточки в интернет-магазине. Пробуйте и экспериментируйте: даже если сгенерированные иллюстрации не подойдут к вашему фирменному стилю, дополнительные функции сервиса как минимум позволят автоматизировать рутину.