Главная / Блог / Как распознать текст на картинке

Разборы

Как распознать текст на картинке

Надёжные варианты сделать всё без ошибок

Натали Азаренко
27 ноября, 2024

43675

Когда нужно извлечь текст с изображения, то самый простой способ очевиден — нужно просто его переписать. Но если надписей или картинок очень много, то выполнить задачу вручную становится сложнее. В этом случае помогут специальные программы и сервисы по автоматическому распознаванию. Рассказываю, как легко распознать текст на картинке и какие инструменты в этом помогут.

Как работает распознавание текста на картинках

Извлечение текста из изображения основано на технологии OCR — оптического распознавания символов. Она включает в себя такие этапы:

Получение и анализ изображения. Программа сканирует картинку и определяет светлые области как фон, а тёмные — как символы и буквы.

Подготовка к распознаванию. Изображение проходит очистку — сглаживается контраст, удаляются пятна, стираются рамки и линии, распознаются шрифты.

Как определить шрифт по картинке

Распознавание текста. Программа сравнивает символы с шаблонами из базы или по отдельным элементам символа ищет наибольшие соответствия.

Итоговая обработка. Результат отображается в текстовом формате. Некоторые системы могут преобразовать извлечённые данные в текстовые файлы — PDF, TXT, DOC.

Для качественного распознавания нужно, чтобы надписи отличались от фона и иллюстраций. Все символы должны быть разборчивыми и чёткими, а строки на картинке — идти ровно, без перекосов и искажений.

Вот какие сервисы можно использовать для извлечения текста из изображений.

Google Lens

Приложение Google Объектив (Lens) может не только извлечь текст с картинки, но и перевести его на другой язык. Распознанные символы можно скопировать с изображения как в обычном текстовом файле.

Кликните по изображению в браузере для вызова контекстного меню и выберите пункт «Найти через Google Объектив». После открытия картинки в Google Lens нажмите на «Текст» и скопируйте символы с картинки через меню или Ctrl + C.

При распознавании текста в Google Lens можно скопировать любой фрагмент

Если кликнуть на «Переводчик», можно сразу перевести результат на любой язык с помощью Google Translate.

Аналогично функция работает и в браузере Google на мобильных устройствах. Нужно нажать на картинку для вызова меню, выбрать «Найти через Google Объектив» и скопировать результат.

Распознанный в Google Lens текст можно прослушать

Кстати, с помощью Google Lens можно распознавать текст на изображениях, сохранённых на мобильном устройстве. Для этого откройте нужный файл в «Галерее» и нажмите на «Поделиться». В разделе «Отправить файлы через…» выберите «Google Поиск по изображению». Картинка откроется в Google Lens, и вы сможете скопировать надписи.

Google Docs

Извлечь текст с картинки помогают и Google Документы. Причём в этом случае можно обрабатывать даже довольно большие файлы — например, длинные сканы страниц. Порядок действий будет таким:

Загрузите фото, скан или изображение на Google Drive.
Кликните по загруженному файлу для вызова меню.
Выберите пункт «Открыть с помощью Google Документы».
В открывшемся документе скопируйте текст, отображаемый под картинкой.

При необходимости результат преобразования можно сразу отредактировать и исправить в нём ошибки.

Преобразование изображения в Google Docs

В Google Docs можно преобразовать в текстовый формат объёмные изображения

20 лайфхаков Google Docs

Длительность обработки картинки в Google Docs зависит от объёма загруженного файла. Но, по личному опыту, на обработку уходит не больше одной минуты.

Яндекс Картинки

Функция распознавания текста есть и в Яндексе.

Кликните на изображение с надписями и в меню выберите «Найти это изображение в Яндексе». Картинка откроется в новом окне. Нажмите на «Распознать текст» в правой части страницы, если автоматического преобразования не произошло.

В Яндекс.Картинки в браузере можно загрузить фото с компьютера

Результат можно скопировать или отправить в «Яндекс Переводчик».

В Яндексе можно перевести любую распознанную картинку

Если нужно извлечь только определённую часть текста, то используйте функцию «Выбрать фрагмент». Выделите нужную часть изображения и активируйте распознавание.

Яндекс умеет извлекать текст из выбранного фрагмента

12 инструментов для перевода голоса в текст

Извлечение текста с картинок поддерживается и в мобильной версии Яндекса. При этом для обработки можно загружать изображения из «Галереи» смартфона.

Дополнительные сервисы

Помимо встроенных инструментов Яндекса и Google, можно применять для распознавания текста и другие сервисы.

ChatGPT

Сайт

ChatGPT — нейросеть, которая видит текст на любых картинках и быстро его выписывает. При этом необязательно, чтобы текст был напечатан — рукописный текст нейронка тоже распознает. Но может допустить ошибки, поэтому ее результат нужно проверять. Распознает форматы JPG, JPEG, PNG.

Чтобы выписать текст, нужно написать в нейросеть запрос «выпиши весь текст с картинки» и прикрепить картинку.

Нейронка может выписать текст объемом до 1-2 страниц. Дальше, скорее всего, собьется и начнет допускать ошибки.

Бесплатно можно отправить 2 запроса. Платная подписка стартует от $20, там можно распознавать неограниченное количество фотографий.

А если платить не хочется, пользуйтесь сервисами из статьи «6 способов попробовать ChatGPT-4 бесплатно».

ChatGPT безошибочно распознал весь текст

Claude

Сайт

Claude — еще одна нейросеть, которая умеет распознавать текст на картинках. Работает все также, как в ChatGPT: загружаете фото с любым текстом и добавляете запрос «выпиши весь текст с картинки». Распознает форматы JPG, JPEG, PNG.

Нейронка может выписать текст объемом до 1-2 страниц. Дальше, скорее всего, собьется и начнет допускать ошибки.

Бесплатно можно расшифровать около 10 картинок, в зависимости от нагрузки на сервера компании. Платная подписка стартует от $20.

Claude верно разобрал весь текст

Convertio

Сайт

Онлайн-сервис Convertio преобразует отсканированные документы и изображения в редактируемые форматы DOC, PDF, XLS и TXT. Бесплатно и без регистрации можно обработать до 10 страниц. После загрузки файла можно выбрать язык документа, формат сохранения результата, номера страниц в файле. Готовый текст доступен для скачивания или отправки в Google Drive либо Dropbox.

На платной версии сервиса потребуется регистрация. Стоимость зависит от объёма предоплаченного пакета — от $4,99 за 50 страниц.

Aspose

Сайт

В Aspose можно бесплатно конвертировать в текст отсканированные документы, изображения, фотографии. Можно загрузить файл, сделать снимок на камеру или указать URL картинки. В списке поддерживаемых языков — 45 вариантов. Есть возможность настроить формат загруженного документа, включить коррекцию контраста и переноса, отрегулировать уровень разрешения.

Тестирование сервиса показало, что он хорошо обрабатывает картинки с небольшим количеством текста. А вот более объёмные документы содержат много ошибок. Хотя, возможно, сервис не устроило качество файлов или что-то ещё.

Цифра Р

Сайт

В сервисе от типографии «Цифра Р» можно бесплатно преобразовать изображения в текст. Поддерживаются только форматы JPG и JPEG. Результат выводится в отдельном окне и доступен для копирования.

Как правильно использовать картинки и фотографии в рассылках

В этом сервисе нет никакого дополнительного функционала и настроек. Но именно своей простотой он и привлекает: загрузить файл, нажать кнопку и скопировать результат. Обработка файлов происходит достаточно быстро.

Online-convert

Сайт

Ещё один инструмент для извлечения текста из изображений, фотографий и других рисунков. В Online-convert поддерживается обработка файлов формата JPG, PNG, TIFF, SVG, BMP, WEBP. Результат сохраняется в текстовый файл TXT. В дополнительных настройках сервиса можно указать все языки, которые используются в файле.

В бесплатной версии сервиса доступны только самые простые функции. Также есть ограничения по размеру файла, количеству задач в сутки, времени обработки. Платный тариф позволяет обрабатывать файлы от 4–8 ГБ и более, без ограничений по количеству документов и с высоким приоритетом. Стоимость платной версии по подписке — от $6,42 в месяц.

«Фото в текст»

Сайт

Бесплатный сервис «Фото в текст» умеет преобразовывать в текстовый формат изображения JPG, JPEG, BMP, PNG, GIF И TIFF. Результат можно скопировать или скачать в виде файла TXT. Сервис поддерживает множество языков, при этом автоматически распознаёт язык документа. Также можно самостоятельно выбрать нужный язык. Картинки загружаются с компьютера, из Dropbox или по URL.

Текст получается довольно качественным. Потестировав сервис, я обнаружила только одну ошибку в тексте объёмом на половину страницы. Конечно, результат во многом зависит от качества исходного оригинала.

Есть и другие инструменты на основе OCR. Например, десктопные программы, которые позволяют локально обрабатывать документы большого объёма. Но для периодического применения и обработки относительно небольших файлов онлайн-сервисы вполне подходят.

Эксклюзивы — читайте только в блоге Unisender

Как повысить open rate? Как «Архитектурные излишества» стали медиа №1 про архитектуру и города Самообразование: плюсы, минусы, рекомендации по выбору курсов Как культура быстрого поиска помогает компаниям расти быстрее Отчетность ИП: какую и куда сдавать в 2025

Ускоряем email-маркетинг с ИИ

Внутри конструктора Unisender — ИИ-ассистент. Поможет составить тему, проверить ошибки  в тексте, нарисовать картинку. И даст рекомендации как маркетолог или психолог.

Хочу попробовать Хочу попробовать

Реклама. ООО «Юнисендер СМАРТ», ИНН 9731091240 erid: 2VSb5xhYdn8