DALL-E — популярная нейросеть для генерации картинок. По функционалу она похожа на Stable Diffusion, FLUX или Midjourney. Однако в отличие от конкурентов, DALL-E понимает обычную разговорную речь на русском или английском — специально составлять промпты необязательно. В статье расскажем, как и где работать с нейросетью бесплатно.
Что такое DALL-E
Нейросеть DALL-E создали в компании OpenAI — это разработчик ChatGPT и других ИИ-продуктов. Первую версию нейронки представили в 2021 году, вторую — в 2022 году. Тогда у DALL-E 2 были улучшены алгоритмы, позволяющие создавать фотореалистичные изображения. В этот период нейросеть стала популярной, так как генерировала качественные картинки и умела считывать запросы на разговорном языке.
Третья версия вышла в 2023 году. Она полностью интегрирована с ChatGPT, еще лучше понимает запросы и создает более точные изображения. РБК приводит пример с картинками, сгенерированными по одному и тому же промпту первой и третьей версией DALL-E. Можно заметить, что генерации стали более детализированными и качественными.
Как работать через ChatGPT
Если вы пользуетесь ChatGPT для маркетинговых нужд, этот способ будет удобен: попросить нужную картинку можно прямо в диалоге с нейросетью. При входе на сайт мы видим поле для запроса, а под ним — несколько функций, из которых нам нужно выбрать первую — Create image («Сгенерировать изображение»).
Отправляем запрос Create image, оказываемся в чате с ботом. Он уточняет, какую именно картинку мы хотим получить. Вводим промпт — сначала на английском: “black cat lying on a table, pastel colors” («черный кот лежит на столе, пастельные тона»). Через несколько секунд нейросеть выдает картинку, соответствующую запросу, а также сообщает, что готова внести корректировки.
Попробуем немного поменять изображение — сделать кота оранжевым. Нейронка выполнила запрос, хотя и не совсем точно: картинка полностью изменилась.
Чтобы проверить, как нейросеть воспринимает промпты на русском, вновь сгенерируем черного кота на фоне в пастельных тонах. Результат очень похож на то, что мы получили в первый раз.
А теперь сделаем запрос в формате разговорной речи: «нарисуй черного котика в пастельных тонах». DALL-E 3 выдает соответствующее изображение. Такие формулировки можно использовать не только в ChatGPT, но и на других платформах, которые мы рассмотрим: нейросеть вас поймет.
Как сохранить картинку: если навести на нее курсор, в правом верхнем углу появится кнопка со стрелочкой для скачивания.
В ChatGPT доступно 4 бесплатные генерации в день. Для более активного использования нейросети придется оформить платную подписку.
Платная версия. Месяц использования ChatGPT Plus с неограниченным числом генераций обойдется в $20.
Как работать через Microsoft Bing
Этот сервис позволяет делать неограниченное количество генераций абсолютно бесплатно. Каждый день платформа выдает 15 монет, которые дают буст — ускоряют генерацию. Bing предупреждает, что когда средства закончатся, нейросеть может дольше создавать картинки.
Одна генерация стоит 1 монету, и при этом DALL-E выдает сразу четыре картинки. Ниже — изображения, созданные по тому же промпту “black cat lying on a table, pastel colors”. Если через ChatGPT получались именно картинки, то через Bing — скорее фотографии, которые можно использовать вместо стоковых изображений.
При вводе запроса на русском языке результат аналогичный.
Как видите, картинки в ChatGPT и Bing получаются настолько разными: пользователи обсуждают эту особенность, но официального объяснения от разработчиков у нас нет. Вероятно, разница связана с параметрами самих платформ. Но если попросить ChatGPT сделать фотореалистичное изображение, он сгенерирует нечто похожее на картинки из Bing.
В свою очередь, в Bing нейросеть тоже способна отступить от фотореализма. На скрине — генерации по запросу «улица с маленькими домиками, на крышах лежит снег, снег падает хлопьями с неба, стиль мультиков из 2000-х».
И еще: «морское дно, разноцветные кораллы, скат плывет на переднем плане, в стиле Ван Гога».
Теперь проверим, насколько хорошо DALL-E 3 справляется с мелкими деталями. У нейронок часто возникают трудности с руками, глазами, задними планами.
По промпту «золотое кольцо на пальце» нейросеть выдала 4 картинки, из которых первая получилась весьма достойной. На второй — сзади видна размытая вторая рука, на третьей — лишнее кольцо, на четвертой — странности с анатомией.
С генерацией лиц людей трудностей нет: нейронка создала 4 корректных мужских портретов.
Некоторые запросы DALL-E 3 автоматически блокирует. Например, нельзя генерировать изображения с реальными людьми, кадры из фильмов и другой контент, который может быть связан с нарушением авторских прав. Также под запрет подпадают картинки, содержащие насилие, ненависть и NSFW-элементы.
В сети есть информация, что нейросеть отказывается создавать картинки в стиле художников, фотографов, режиссеров, живших в последние 100 лет. Но это не совсем так.
В случае с фильмами ситуация уже спорная. Нейронка блокирует промпт на генерацию лиса из «Бесподобного мистера Фокса» Уэса Андерсона.
Но готова воспроизвести черный вигвам из сериала «Твин Пикс».
На художников, судя по всему, ограничение не распространяется вовсе. DALL-E 3 сгенерировала изображения в стиле Сальвадора Дали, который дожил до конца XX века.
Также нейронка повторила изображения знаменитых банок супа Campbell’s, созданные Энди Уорхолом в 1960-е годы.
DALL-E спокойно имитирует и современных творцов, например, английского стрит-арт художника Бэнкси. Причем за основу взята одна из самых известных работ.
В разделе Explore ideas размещена библиотека картинок, созданных в нейросети. Можно посмотреть промпты, оценить возможности DALL-E 3 и вдохновиться.
Для тех, у кого пока нет идей для промптов, есть кнопка Surprise Me. Если нажать на нее, в поле появится рандомный запрос. Кликаем Create, получаем картинку.
Чтобы скачать изображение с Bing, нужно нажать на понравившуюся картинку и — на кнопку Download.
Платная версия. Пользователи интересуются возможностью получить доступ к Bing без ограничения бустами, но платной подписки сейчас нет. Если задержка скорости будет для вас критичной, можно работать с нескольких аккаунтов.
Как работать на платформе AIR
Сервис позволяет работать с несколькими нейронками для генерации текста и изображений. Для создания картинок на сайте есть DALL-E, Stable Diffusion, FLUX, Kandinsky и другие ИИ.
Изначально у пользователя на счету 5 токенов. На сайте указано, что за «примерно 1 токен» можно сгенерировать текст в ChatGPT. А за «примерно 4» — картинку в Kandinsky.
Проверим, сколько стоит генерация картинки в DALL-E 3 при стандартном качестве и размере 1024х1024. Первые 3 изображения нейросеть сгенерировала бесплатно — вероятно, это пробное количество.
За следующую картинку платформа просит уже 24 токена. А их нужно покупать за реальные деньги.
Платная версия. Стоимость: 1000 токенов — 990 ₽, 3000 токенов — 2990 ₽, 10 000 токенов — 9900 ₽. Можно оплатить картой российского банка.
Как работать на платформе dalle3.org
У этого сервиса есть бесплатный тариф, в рамках которого первые 7 дней зарегистрированный пользователь получает по 10 генераций в день и возможность создавать по 2 изображения одновременно.
Интерфейс страницы нейросети отличается от привычного. Под полем для запроса находится строка для ввода негативного промпта: можно указать, чего на изображении быть не должно. Ниже расположено несколько моделей на выбор. Каждая из них позволяет создавать картинки конкретного характера: реалистичные, яркие и детализированные, в аниме-стилистике, делать четкие надписи. Попросим сгенерировать того же черного кота в пастельных тонах и укажем отрицательный запрос — «окно».
Ниже — изображения, созданные по параметрам четырех моделей.
Для загрузки нужно выбрать картинку в разделе «Ваши сгенерированные изображения» и нажать «Скачать».
Платная версия. Если вам не хватит бесплатных возможностей, есть несколько вариантов подписки. На тарифе Pro за 5$ в месяц — 1000 быстрых генераций в месяц и по 4 картинки одновременно. На тарифе Max за 10$ в месяц — 3000 быстрых генераций в месяц, все возможности Pro-тарифа, а также функцию работы с личными изображениями.
Плюсы и минусы DALL-E 3
Преимущества | Недостатки |
Умеет генерировать сложные изображения с высокой детализацией | Фотореалистичные картинки получаются не всегда хорошо |
Создает изображения в разных стилях | Есть ограничение на некоторые типы контента |
Понимает запросы на разговорном языке | Есть ограничение на бесплатный доступ |
Интеграция с ChatGPT будет удобна тем, кто часто работает с этой нейронкой | В генерации текста внутри картинки часто возникают ошибки |
СВЕЖИЕ СТАТЬИ
Не пропускайте новые статьи
Подписывайтесь на соцсети
Делимся новостями и свежими статьями, рассказываем о новинках сервиса
«Честно» — авторская рассылка от редакции Unisender
Искренние письма о работе и жизни. Свежие статьи из блога. Эксклюзивные кейсы и интервью с экспертами диджитала.