Разборы

Как распознать текст на картинке

Надёжные варианты сделать всё без ошибок
Как распознать текст с картинки

Когда нужно извлечь текст с изображения, то самый простой способ очевиден — нужно просто его переписать. Но если надписей или картинок очень много, то выполнить задачу вручную становится сложнее. В этом случае помогут специальные программы и сервисы по автоматическому распознаванию. Рассказываю, как легко распознать текст на картинке и какие инструменты в этом помогут.

Распознавание текста с картинки

Как работает распознавание текста на картинках

Извлечение текста из изображения основано на технологии OCR — оптического распознавания символов. Она включает в себя такие этапы:

Получение и анализ изображения. Программа сканирует картинку и определяет светлые области как фон, а тёмные — как символы и буквы.

Подготовка к распознаванию. Изображение проходит очистку — сглаживается контраст, удаляются пятна, стираются рамки и линии, распознаются шрифты. 

Распознавание текста. Программа сравнивает символы с шаблонами из базы или по отдельным элементам символа ищет наибольшие соответствия. 

Итоговая обработка. Результат отображается в текстовом формате. Некоторые системы могут преобразовать извлечённые данные в текстовые файлы — PDF, TXT, DOC. 

Для качественного распознавания нужно, чтобы надписи отличались от фона и иллюстраций. Все символы должны быть разборчивыми и чёткими, а строки на картинке — идти ровно, без перекосов и искажений. 

Вот какие сервисы можно использовать для извлечения текста из изображений.

Google Lens

Приложение Google Объектив (Lens) может не только извлечь текст с картинки, но и перевести его на другой язык. Распознанные символы можно скопировать с изображения как в обычном текстовом файле. 

Кликните по изображению в браузере для вызова контекстного меню и выберите пункт «Найти через Google Объектив». После открытия картинки в Google Lens нажмите на «Текст» и скопируйте символы с картинки через меню или Ctrl + C.

Google Lens в браузере
При распознавании текста в Google Lens можно скопировать любой фрагмент

Если кликнуть на «Переводчик», можно сразу перевести результат на любой язык с помощью Google Translate. 

Аналогично функция работает и в браузере Google на мобильных устройствах. Нужно нажать на картинку для вызова меню, выбрать «Найти через Google Объектив» и скопировать результат.

Google Lens на мобильном устройстве
Распознанный в Google Lens текст можно прослушать

Кстати, с помощью Google Lens можно распознавать текст на изображениях, сохранённых на мобильном устройстве. Для этого откройте нужный файл в «Галерее» и нажмите на «Поделиться». В разделе «Отправить файлы через…» выберите «Google Поиск по изображению». Картинка откроется в Google Lens, и вы сможете скопировать надписи.

Google Docs

Извлечь текст с картинки помогают и Google Документы. Причём в этом случае можно обрабатывать даже довольно большие файлы — например, длинные сканы страниц. Порядок действий будет таким: 

  1. Загрузите фото, скан или изображение на Google Drive. 
  2. Кликните по загруженному файлу для вызова меню. 
  3. Выберите пункт «Открыть с помощью Google Документы». 
  4. В открывшемся документе скопируйте текст, отображаемый под картинкой. 

При необходимости результат преобразования можно сразу отредактировать и исправить в нём ошибки.

Преобразование изображения в Google Docs
В Google Docs можно преобразовать в текстовый формат объёмные изображения

Длительность обработки картинки в Google Docs зависит от объёма загруженного файла. Но, по личному опыту, на обработку уходит не больше одной минуты.

Яндекс Картинки

Функция распознавания текста есть и в Яндексе.

Кликните на изображение с надписями и в меню выберите «Найти это изображение в Яндексе». Картинка откроется в новом окне. Нажмите на «Распознать текст» в правой части страницы, если автоматического преобразования не произошло.

OCR в Яндекс.Картинки
В Яндекс.Картинки в браузере можно загрузить фото с компьютера

Результат можно скопировать или отправить в «Яндекс Переводчик».

Перевод изображения в Яндексе
В Яндексе можно перевести любую распознанную картинку

Если нужно извлечь только определённую часть текста, то используйте функцию «Выбрать фрагмент». Выделите нужную часть изображения и активируйте распознавание.

Выбор фрагмента картинки для преобразования в Яндексе
Яндекс умеет извлекать текст из выбранного фрагмента

Извлечение текста с картинок поддерживается и в мобильной версии Яндекса. При этом для обработки можно загружать изображения из «Галереи» смартфона.

Дополнительные сервисы

Помимо встроенных инструментов Яндекса и Google, можно применять для распознавания текста и другие сервисы.

ChatGPT

Сайт

ChatGPT — нейросеть, которая видит текст на любых картинках и быстро его выписывает. При этом необязательно, чтобы текст был напечатан — рукописный текст нейронка тоже распознает. Но может допустить ошибки, поэтому ее результат нужно проверять. Распознает форматы JPG, JPEG, PNG.

Чтобы выписать текст, нужно написать в нейросеть запрос «выпиши весь текст с картинки» и прикрепить картинку. 

Нейронка может выписать текст объемом до 1-2 страниц. Дальше, скорее всего, собьется и начнет допускать ошибки. 

Бесплатно можно отправить 2 запроса. Платная подписка стартует от $20, там можно распознавать неограниченное количество фотографий.

А если платить не хочется, пользуйтесь сервисами из статьи «6 способов попробовать ChatGPT-4 бесплатно».

ChatGPT безошибочно распознал весь текст
ChatGPT безошибочно распознал весь текст

Claude

Сайт

Claude — еще одна нейросеть, которая умеет распознавать текст на картинках. Работает все также, как в ChatGPT: загружаете фото с любым текстом и добавляете запрос «выпиши весь текст с картинки». Распознает форматы JPG, JPEG, PNG. 

Нейронка может выписать текст объемом до 1-2 страниц. Дальше, скорее всего, собьется и начнет допускать ошибки. 

Бесплатно можно расшифровать около 10 картинок, в зависимости от нагрузки на сервера компании. Платная подписка стартует от $20.

Claude верно разобрал весь текст
Claude верно разобрал весь текст

Convertio

Сайт

Онлайн-сервис Convertio преобразует отсканированные документы и изображения в редактируемые форматы DOC, PDF, XLS и TXT. Бесплатно и без регистрации можно обработать до 10 страниц. После загрузки файла можно выбрать язык документа, формат сохранения результата, номера страниц в файле. Готовый текст доступен для скачивания или отправки в Google Drive либо Dropbox. 

Convertio

На платной версии сервиса потребуется регистрация. Стоимость зависит от объёма предоплаченного пакета — от $4,99 за 50 страниц. 

 

Aspose

Сайт 

В Aspose можно бесплатно конвертировать в текст отсканированные документы, изображения, фотографии. Можно загрузить файл, сделать снимок на камеру или указать URL картинки. В списке поддерживаемых языков — 45 вариантов. Есть возможность настроить формат загруженного документа, включить коррекцию контраста и переноса, отрегулировать уровень разрешения. 

Aspose

Тестирование сервиса показало, что он хорошо обрабатывает картинки с небольшим количеством текста. А вот более объёмные документы содержат много ошибок. Хотя, возможно, сервис не устроило качество файлов или что-то ещё. 

 

Цифра Р

Сайт 

В сервисе от типографии «Цифра Р» можно бесплатно преобразовать изображения в текст. Поддерживаются только форматы JPG и JPEG. Результат выводится в отдельном окне и доступен для копирования.

В этом сервисе нет никакого дополнительного функционала и настроек. Но именно своей простотой он и привлекает: загрузить файл, нажать кнопку и скопировать результат. Обработка файлов происходит достаточно быстро. 

 

Online-convert

Сайт 

Ещё один инструмент для извлечения текста из изображений, фотографий и других рисунков. В Online-convert поддерживается обработка файлов формата JPG, PNG, TIFF, SVG, BMP, WEBP. Результат сохраняется в текстовый файл TXT. В дополнительных настройках сервиса можно указать все языки, которые используются в файле.

Online-convert

В бесплатной версии сервиса доступны только самые простые функции. Также есть ограничения по размеру файла, количеству задач в сутки, времени обработки. Платный тариф позволяет обрабатывать файлы от 4–8 ГБ и более, без ограничений по количеству документов и с высоким приоритетом. Стоимость платной версии по подписке — от $6,42 в месяц. 

 

«Фото в текст»

Сайт 

Бесплатный сервис «Фото в текст» умеет преобразовывать в текстовый формат изображения JPG, JPEG, BMP, PNG, GIF И TIFF. Результат можно скопировать или скачать в виде файла TXT. Сервис поддерживает множество языков, при этом автоматически распознаёт язык документа. Также можно самостоятельно выбрать нужный язык. Картинки загружаются с компьютера, из Dropbox или по URL.

«Фото в текст»

Текст получается довольно качественным. Потестировав сервис, я обнаружила только одну ошибку в тексте объёмом на половину страницы. Конечно, результат во многом зависит от качества исходного оригинала.

Есть и другие инструменты на основе OCR. Например, десктопные программы, которые позволяют локально обрабатывать документы большого объёма. Но для периодического применения и обработки относительно небольших файлов онлайн-сервисы вполне подходят.