Программа DjvuOCR представляет собой конвертор файла в формате Djvu в любой другой графический формат (jpg,tiff,png,gif,bmp)
и позволяет сохранить файл Djvu в заданное при конвертации количество страниц с заданным разрешением сканирования (от 25 до 2500) ,а также сохранять текст и изображения или весь документ, откидывать фон ,выбирать размер сохраняемого файла ...
После того, как программа перевела файлы Djvu в графический формат , их легко можно распознать ABBYY FineReaderom и сохранить в любом удобном Вам формате (doc,pdf,txt) ,если Вы скачали книгу или оставить файлы в графическом формате ,если это чертежи ,схемы или фотографии ,что позволяет легко просматривать и редактировать нужную информацию.
Программа для добавление OCR информации к DJVU-книги
с помощью програму распознавания текста FineReader версии 7.x/8.x
OCR-информация в DJVU-книга позволяет поиск и копирование текста.
Основная идея програмы:
1) Есть Djvu-книга
2) Программа помогает извлечь из нее графические изображения страниц - тиффы;
3) Загружаем их в FineReader и распознаем;
4) Программа обрабатывает рабочие файлы FineReader-а, извлекается нужная информация и создает OCR-слой в первоначальную книгу.
Используем FineReader как лучший продукт распознавания текста. Вполне достаточно использовать try&buy или demo версию.
Нужная документация как работает программа и что еще можно с ней сделать, находится в папке \doc.
Программы:
FRFGrab - консольная версия
DjvuOCR - Win32 GUI версия
cvthtml2 - конверсия выходного OCR-текста в HTML (UTF8)
Djvused - стандартная утилита пакета djvulibre
DjvuDecoder - стандартная утилита для извлечение графических изображении страниц из DJVU-книги
Размер: 1, 11 Мб
Скачать