Лучшие сайты и программы для распознавания текста с фото
Оптическое распознавание символов (OCR) — современная технология, позволяющая конвертировать текстовую информацию в файлах изображений, полученных с цифровой камеры, смартфона, сканера и прочих мультимедийных устройств.
Эффективность оцифровки текста в значительной степени зависит от качества исходного изображения — четкости символов, разрешения фотографии и отсутствия посторонних элементов на основном фоне. Поэтому одними из важнейших функций для такого софта станут возможности для ручной или автоматической коррекции картинки, настройки яркости и контрастности.
При выборе программы стоит учитывать возможность пакетного редактирования, перечень поддерживаемых форматов файлов и совместимость с операционными системами. Наличие дополнительных функций для модификации обработанных документов без установки стороннего ПО и поддержка разнообразных наречий и диалектов станут дополнительными плюсами в пользу выбора того или иного продукта.
Большинство приложений для распознавания текста с картинок распространяются на платной основе или с ограниченным функционалом, например, отключенной функцией для обработки многостраничных PDF-документов. Это может стать серьезной проблемой при выборе высокопроизводительного ПО, однако бесплатные программы могут справиться с конвертацией изображений не хуже платных аналогов.
1. FineReader
- Сайт программы: pdf.abbyy.com/ru
- Цена: демоверсия; лицензия сроком на 3 года предлагается по цене от 7190 до 39990 рублей в зависимости от редакции
- Платформа: Windows, Mac OS
Программа для оцифровки текста Fine Reader — одна из старейших на рынке аналогичных продуктов, разработана корпорацией ABBYY 28 лет назад. Функционал утилиты включает возможности для создания, модификации и совместной работы с PDF-документами, добавления подписей и защиты от изменения сторонними пользователями.
ABBYY Fine Reader позволяет сравнивать файлы с текстовой информацией в разных форматах, разделять многостраничный документ на несколько мелкоформатных в автоматическом режиме.
Сканер изображений умеет создавать и модифицировать формы для добавления интерактивных элементов в документах PDF, что позволяет встроить в структуру кнопки для выполнения назначенных команд, опросы с несколькими вариантами ответов, выпадающие списки.
Одна из наиболее популярных функций утилиты — распознавание текста. Программа умеет обрабатывать текст с фотографий и отсканированных изображений на 198 мировых языках. Полученный результат можно сохранить для последующего редактирования в родном формате PDF или офисных DOCX, TXT и т. д.
ABBYY Fine Reader поставляется в трех редакциях: Standard для домашнего использования, Business и Corporate для коммерческого. Для оценки функционала утилиты пользователям доступна загрузка демоверсии с ограничением по сроку действия и операциям сравнения и конвертирования (100 для Standard, 500 для Business и Corporate).
2. Office Lens
- Сайт программы: Microsoft Lens — PDF Scanner
- Цена: бесплатно
- Платформа: iOS, Android
Это приложение для распознавания текста с фото от международного IT-гиганта Microsoft. Office Lens предлагает пользователям 4 режима обработки фотографий: для сканирования досок с презентациями, бумажной документации, стандартных типов изображений (например, автопортретных снимков или пейзажей) и создания визитных карточек.
Приложение поддерживает съемку с любого ракурса, автоматическое выравнивание и удаление лишних элементов с изображения — рук, посторонних предметов, текстур поверхности и т. д.
Бесплатное приложение-сканер наряду с обработкой снимков с камеры позволяет импортировать фотографии с внутреннего накопителя. Пользователь может поделиться результатами распознавания по электронной почте, сохранить как документ PDF или Word для последующего редактирования текстовой информации, создать презентацию PowerPoint.
Главный недостаток Office Lens — невозможность использования приложения для распознавания картинок на ПК. Разработчик прекратил поддержку продукта для Windows 10 в конце 2020 года, отключив ряд функций, позволявших работать с облачными сервисами OneDrive и OneNote.
3. CamScanner
- Сайт программы: www.camscanner.com
- Цена: базовый функционал — бесплатно, дополнительные функции — платно
- Платформа: Windows, Mac OS, iOS, Android, веб-версия
CamScanner позволяет сканировать и моделировать фотографии на смартфоне или персональном компьютере. Пользователь может обрабатывать снимки с камеры или внутреннего накопителя мобильного устройства с автоматическим определением границ будущего документа, регулируемым уровнем детализации, контрастности и яркости для конечного изображения.
Редакция приложения для мобильных устройств сохраняет обработанные фотографии в файлы PDF, позволяет корректировать размер и ориентацию изображения, присваивать уникальные метки файлам для быстрого поиска, что полезно при наличии большой библиотеки изображений на смартфоне.
Режим редактирования дает возможность добавлять к созданным фото записки или встраивать водяной знак для защиты авторских прав, использовать инструменты «кисть» и «ластик». Однако этот функционал активируется только после скачивания плагина.
Дополнительная функция CamScanner — распознавание текста на изображении, подключается также с помощью инсталляции стороннего приложения от данного разработчика.
Приложение для редактирования фотографий можно использовать и в веб-формате — распознавание текста доступно онлайн после регистрации на официальном сайте.
Главными минусами программы являются наличие всплывающей рекламы и ограничений на отдельные функции — эти недостатки исчезают после активации платной версии.
4. Online OCR
- Сайт программы: www.onlineocr.net/ru
- Цена: бесплатно с рядом ограничений
- Платформа: веб
Онлайн-сервис для определения текста по фото предоставляет возможности для работы с 5 популярными форматами файлов: PDF, BMP, GIF, JPG, TIFF. Перечень поддерживаемых языков включает 46 международных наречий и диалектов, включая русский.
По заявлениям разработчиков сайта, Online OCR можно применять для распознавания фотографий вне зависимости от операционной системы на ПК или мобильном устройстве.
Результат конвертации изображений можно сохранить на жесткий диск для последующего редактирования в 3 форматах: простого текста (TXT), документа Word (DOCX) или электронной таблицы (XLSX).
Считывание текста с картинки онлайн на сервисе ограничено 15 конвертациями в час, однако пользователи могут получить от 200 до 2 тысяч бонусных попыток за продвижение на сторонних сайтах или создание обучающего видеоматериала по особенностям использования портала распознавания изображений.
Бесплатная регистрация на портале расширяет перечень форматов вывода и добавляет возможность работы с многостраничными PDF-документами.
Online OCR дополнительно дает возможность добавить технологию оптического распознавания букв на другие ресурсы — для получения подробной информации пользователям рекомендуется посетить веб-сайт ее создателей (www.ocrwebservice.com).
Один из недостатков сервиса – наличие объемных рекламных блоков, однако этот факт можно рассматривать как малозначимый при предоставляемом порталом бесплатном функционале.
5. Go4convert
- Сайт программы: go4convert.com/ru/text-ocr
- Цена: бесплатно
- Платформа: веб
Портал Go4convert предлагает пользователям функционал для распознавания текста онлайн с картинок JPG, PDF, BMP, GIF, TIFF, PNG. Поддерживается загрузка с жесткого диска, вставка картинок, размещенных по указанному пользователем URL-адресу в специальную форму на сайте.
Сервис умеет обрабатывать изображения, содержащие текст на 30 наречиях и диалектах, включая русский.
Главное преимущество сайта для OCR-обработки изображений — отсутствие ограничений вне зависимости от числа страниц исходного документа. Дополнительно стоит отметить ряд бесплатных функций, которые доступны пользователям Go4convert без посещения сторонних ресурсов: конвертеры форматов изображений и текста, инструмент для сжатия, разделения или объединения набора PDF-файлов.
6. Img2txt
- Сайт программы: img2txt.com/ru
- Цена: бесплатно
- Платформа: веб
Онлайн-ресурс Img2txt аналогичен предыдущему, позволяет без ограничений распознавать текст с изображений с поддержкой 35 международных языков с применением движка Tesseract OCR. Пользователям доступна загрузка фотографий с компьютера в форматах PNG, JPG и PDF, включая многостраничные документы, предельный размер файла ограничен 8 МБ.
Результат конвертации изображений сохраняется в простом текстовом формате, документах Word или OpenOffice, а также PDF. Отдельные функции Img2txt пребывают в стадии разработки — возможность распознавания по URL-адресу и сканирования выбранного фрагмента фотографии.
7. ABBYY TextGrabber
- Сайт программы: TextGrabber Офлайн Распознавание Текста + Перевод
- Цена: стоимость варьируется в зависимости от выбранного пользователем функционала и составляет от 99 до 450 рублей для Android-версии, от 1 до 5 долларов для редакции под iOS
- Платформа: iOS, Android
TextGrabber — программный продукт от компании ABBYY, специализирующейся на решениях для распознавания текста с фотографий. Приложение поддерживает 60 языков и наречий, включая английский и русский. Обработка изображений возможна онлайн и при отсутствии подключения к Интернету.
Одна из уникальных особенностей TextGrabber — возможность перевода напечатанного текста в цифровое представление без съемки камерой, которая реализуется посредством запатентованной технологии ABBYY RTR SDK.
Приложение умеет в автоматическом режиме обрабатывать URL-адреса, телефонные номера, прочие типы ссылок, что позволяет сделать их кликабельными и сразу посетить нужный ресурс. Функционал утилиты также включает инструменты для редактирования, объединения или удаления обработанных текстов в библиотеке заметок, возможность экспорта текста в любое приложение на устройстве для последующей модификации.
Главные недостатки приложения для обработки фотографий: платное распространение, наличие рекламы, результат можно просмотреть только в формате TXT без форматирования. Эти минусы исчезают после покупки утилиты.
8. Adobe Scan
- Сайт программы: Adobe Scan: сканер PDF, OCR
- Цена: бесплатно, отдельные функции — платные
- Платформа: iOS, Android
Это бесплатное приложение для распознавания текста с картинок от популярного разработчика ПО для создания медиаконтента. Adobe Scan поддерживает автоматическую обрезку границ изображения и несколько режимов интеллектуального сканирования, выбираемых в зависимости от типа обрабатываемого документа. Пользователям доступна конвертация визитных карточек, досок презентаций, форм и т. п.
Приложение работает на базе технологии Adobe Sensei, позволяющей удалять тени и солнечные блики с фотографии, увеличить четкость шрифта при посредственном качестве исходного изображения, исправить перспективу фото. Результат конвертации сохраняется в формате JPEG или «родном» PDF для последующего редактирования в стороннем приложении разработчика — Acrobat Reader.
Главный недостаток Adobe Scan — наличие платных функций (например, возможностей для совместного редактирования файлов), работать с которыми можно только после приобретения подписки на Adobe Acrobat Reader стоимостью 770 рублей в месяц.
На официальном портале разработчика доступна полнофункциональная демоверсия сроком на 7 дней — по истечении этого периода пользователи смогут заполнять формы, редактировать и комментировать отсканированные документы, однако для возврата других возможностей нужно купить Acrobat Reader.
9. Readiris 17
- Сайт программы: www.irislink.com/EN-US/c1760/Readiris-17
- Цена: условно-бесплатно
- Платформа: Windows, MacOS
Программный пакет Readiris 17 от разработчика I.R.I.S позволяет распознавать текст с изображений с автоматическим сохранением результатов в популярные офисные форматы. В утилите реализован экспорт в файлы PDF, CSV, TXT, HTML, DOCX, DOC и RTF, включая функционал для пакетной обработки, поддерживается работа с цифровыми фотоаппаратами.
Readiris 17 дает возможность встраивать аннотации и водяные знаки в PDF-документы, добавлять комментарии, сливать несколько файлов в один, распознавать формулы, символы и штрих-коды, организовать рабочую среду.
Пользователь может выкладывать отсканированные файлы в социальные сети — работа и редактирование доступны в SharePoint, Google Docs, Evernote, Dropbox и т. д. Программа поддерживает распознавание более 130 языков.
Readiris 17 представлен в 3 редакциях — Standard, 365 и Business, различающихся функционалом и стоимостью. Базовая версия с минимальным набором опций доступна по цене 129 долларов, при этом отдельные процедуры недоступны для использования — например, сканирование документа с автоматическим поворотом или создание сжатых PDF-файлов.
Корпоративная версия не имеет ограничений по функционалу, приобрести ее можно за 199 долларов, пользователю доступен 10-дневный деморежим.
10. Convertio.co
- Сайт программы: convertio.co/ru/ocr
- Цена: бесплатно, необходима регистрация
- Платформа: веб
Онлайн-сервис для распознавания текста по фото позволяет сканировать изображения со сторонних облачных сервисов или жесткого диска пользователя с последующим сохранением результата для работы в офисных приложениях. Конвертер поддерживает выгрузку документов в форматах DJVU, PDF, EPUB, FB2, распознавание текста возможно с картинок JPEG, TIFF, BMP, GIF, PCX и т. п.
Преобразователь изображений Convertio поддерживает работу с полусотней языков. Сервис позволяет выгрузить результат в Dropbox и Google Drive, умеет работать с функцией drag’n’drop для обработки изображений простым перетаскиванием в окно браузера.
Пользователи могут работать с Convertio бесплатно, однако в этом режиме лимит на распознавание изображений ограничен 10 попытками.
11. Convertonlinefree.com
- Сайт программы: convertonlinefree.com
- Цена: бесплатно
- Платформа: веб
Convertonlinefree — бесплатный онлайн-сервис для конвертации изображений, содержащих текстовую информацию на 20 международных языках. Поддерживается работа с графическими файлами в 6 популярных форматах — PDF, BMP, PNG, JPEG, GIF и TIFF.
Онлайн-программа для распознавания текста с фото умеет конвертировать отдельные изображения и пакеты картинок, заархивированных в ZIP-формате. Обработка файлов происходит на удаленных серверах, итоговый результат отображается в окне браузера.
По заверениям создателей портала, быстродействие сервиса напрямую зависит от скорости интернет-соединения, качества и размера исходного файла. При проблемах с распознаванием Convertonlinefree умеет подсвечивать ошибки с описанием вероятных причин.
Один из относительных недостатков сервиса — ограничение по количеству страниц в исходном документе и одновременно обрабатываемых файлов при обработке ZIP-архивов на 1 сессию. При конвертации объемных файлов пользователь должен разделить PDF-документ на более мелкие части, однако такую процедуру можно провести в другом разделе портала, не используя сторонние ресурсы.
12. Imgonline.com.ua
- Сайт программы: www.imgonline.com.ua/ocr.php
- Цена: бесплатно
- Платформа: веб
Портал Imgonline от украинских разработчиков позволяет работать с изображениями, используя функции редактирования, добавления эффектов или конвертирования файлов в одиночном или пакетном режиме. В перечне представленных на сайте средств пользователям доступна опция OCR — распознавания текста с картинок в форматах BMP, JPEG, TIFF, GIF и PNG.
Бесплатный онлайн-конвертер умеет работать с изображениями, содержащими наборы букв из более чем тридцати международных языков. Для улучшения обработки картинок пользователь может вручную указать присутствующие на сфотографированном изображении языки, при этом максимально возможное количество для одновременной обработки — пять.
При посредственном качестве конвертации, например, мутной или нечеткой исходной картинке, Imgonline умеет использовать дополнительный алгоритм для повышения эффективности распознавания.
Результат обработки пользователь может сохранить в стандартном текстовом формате TXT с кодировкой UTF-8, что определяет один из значимых недостатков сервиса — отсутствие поддержки прочих типов файлов.
13. Оcrconvert.com
- Сайт программы: www.ocrconvert.com
- Цена: бесплатно
- Платформа: веб
Сервис может распознать текст из файлов в 5 популярных графических форматах: BMP, JPEG, PDF, GIF и PNG, а также картинки, размещенные по заданному пользователем URL-адресу. Сайт позволяет работать с 30 международными языками, включая русский.
В числе полезных опций Оcrconvert.com — API для добавления функционала сайта в сторонние приложения, рассылка уведомлений о завершении процесса конвертации, благодаря чему пользователю не нужно находиться на странице во время процесса.
При обработке файлов с низким разрешением сервис автоматически корректирует настройки конвертации для достижения наилучших результатов. Оцифровка файлов бесплатна и предоставляется без ограничений по количеству.
Оcrconvert.com поддерживает изображения размером до 5 МБ. Итоговый результат может быть сохранен только в стандартный текстовый файл формата TXT.
14. i2OCR
- Сайт программы: www.i2ocr.com
- Цена: бесплатно
- Платформа: веб
Онлайн-ресурс для считывания текста с картинки i2OCR аналогичен предыдущему, однако поддерживает большее количество языков и форматов исходных изображений. Пользователю доступна оцифровка файлов PNG, PPM, JPG, PBM, BMP, TIFF и PGM, работа с картинками, содержащими текст на сотне международных наречий, включая экзотические — инуктитут (Канада), панджаби или киргизский язык.
i2OCR поддерживает сохранение результатов в форматах HTML, DOCX и TXT. Позволяет создавать PDF-документы в стандартном исполнении и с возможностью поиска (PDF/A), умеет распознавать изображения с текстом, разбитым на колонки.
Полученный текст пользователь может загрузить в Google Docs для быстрого редактирования или перевести на другой язык с помощью сервисов поисковой системы Bing. Использование сервиса не требует регистрации, бесплатно без ограничений по числу конвертаций.