gyra
Moderator | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору serg28serg ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню что бы откликалось в поисковике яндекса : "Как распознать текст через встроенный OCR в ScanKromsator", " tesseract" 1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : ) скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72 2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator 3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл 4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!! 5. OCR работает только с BW файлами , выбрать в Files->Color - B/W 6. сохранить как task и Закрыть-Открыт SK , с сохраненным task ......добавляем наши сканы... меняем остальные настройки как нужно нам.... 7. Генерим выходной TIFF B/W 8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All 9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход 10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом 11. File > Create out task 12. в вкладках под файлами - в Files задаем имя выходного PDF - PDF Name : myfirstOCR (или имя какое придумаем) . 13. так же в вкладке Files задаем Output format : PDF 14. в вкладке PDF отмечаем обязательно галочку Add OCR 15. Сохраняем task (не проверял есть ли автосохран) 16. Жмем уже "главную кнопку" в верхней морде "Process!" и смотрим результат (указал минималку что нужна для OCR PDF , остальное естественно по желанию и хотелкам) может будут всплывать сообщения о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75. может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator" http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2980#17 обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR. | Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023 |
|