Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
del
Не сразу понял задачу.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 16:21 10-08-2023 | Исправлено: jourmager, 16:42 10-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Спасибо. Неплохо.
mvk2006
Тут с интонацией получше.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 16:57 10-08-2023 | Исправлено: bolega, 17:05 10-08-2023
Izich

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нигде не могу найти ocr.dll Где он?
И использую приложение, которое дает готовые hocr (из тессеракта) постранично. Как мне подключить их уже готовых hocr к СК?

Всего записей: 8 | Зарегистр. 01-08-2023 | Отправлено: 03:33 11-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Izich
Дайте пожалуйста несколько hocr-файлов и соответствующих им обработанных страниц.  
Подключение OCR через hOCR стоит у меня в планах (to do list).
Tesseract должен запускаться с опцией hocr_char_boxes=1
 
ocr2.dll: see
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2420#17
>
https://workupload.com/file/BLuUj5mbpMx

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 09:56 11-08-2023 | Исправлено: bolega, 09:58 11-08-2023
Izich

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо за ссылку на Парсер (до этого не мог найти)!
Возможно провести замену глифами apply all для всех страниц книги после analyse all pages сразу, чтобы не приходилось это делать постранично?

Всего записей: 8 | Зарегистр. 01-08-2023 | Отправлено: 15:16 11-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Возможно провести замену глифами apply all для всех страниц книги после analyse all pages сразу, чтобы не приходилось это делать постранично?

У кнопки Apply all есть выпадающая команда apply to files...
Замена без предварительной тщательной проверки очень рискованна.
Поэтому при выполнении apply to files СК создает bak-файлы перед изменением.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 16:14 11-08-2023
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
СК создает bak-файлы перед изменением

Очень ценная вещь...

Всего записей: 1795 | Зарегистр. 15-06-2006 | Отправлено: 19:12 11-08-2023 | Исправлено: Benoni, 19:19 11-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
Подключение OCR через hOCR стоит у меня в планах (to do list).
 

Тогда на всякий:
  • tesseract2djvused - конвертер с парсером на базе QXML.
  • hocr-tools - пайтоновские парсеры на базе lxml.

  • Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 03:23 12-08-2023 | Исправлено: zvezdochiot, 03:34 12-08-2023
    shch_vg

    Gold Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    bolega
    Иногда возникает проблема из-за опасной близости  двух пиктограмм в режиме просмотра, а именно, Next page и Last page. При последовательном просмотре обработанных сканов, используя первую пиктограмму, постепенно курсор мыши перемещается на вторую, а все внимание приковано к содержимому текущего скана, в результате вместо очередного скана мы оказываемся на последнем, не понимая, как найти скан, который мы просмотривали перед этим.
    Знатокам СК
    Нельзя ли реализовать один из двух вариантов.
    1. Добавить пиктограмму возврата на предыдущий просмотренный скан наподобие пиктограммы Назад в программе WinDjView.
    2. Дать возможным делать disable|enable пиктограммы Last page по ПКМ перед началом такого просмотра.

    Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 13:27 16-08-2023 | Исправлено: shch_vg, 13:34 16-08-2023
    bolega

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    shch_vg

    Цитата:
    Добавить пиктограмму возврата на предыдущий просмотренный скан наподобие пиктограммы Назад

    В хрестоматии описан способ возврата - backspace

    Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 13:45 16-08-2023
    kamenkapenza



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Друзья, что это может быть, вот тут, что за ошибка https://disk.yandex.ru/i/pArrQPaeGUfqDQ  ?

    Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 16:08 16-08-2023 | Исправлено: kamenkapenza, 16:39 16-08-2023
    shch_vg

    Gold Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    bolega

    Цитата:
    backspace

    Спасибо, не знал.

    Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 17:02 16-08-2023 | Исправлено: shch_vg, 17:15 16-08-2023
    mvk2006



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    shch_vg
    А что в File - Options - Misc - OCR mode?  
    и нет ли символов в protected chars (Exclusive Page options - вкладка protect) ?
     
    Зов о Помощи отменяется?

    Всего записей: 515 | Зарегистр. 15-10-2005 | Отправлено: 17:17 16-08-2023 | Исправлено: mvk2006, 17:19 16-08-2023
    bolega

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Друзья, что это может быть, вот тут, что за ошибка

    Припоминаю. Точно уже причину не помню, но это был редчайший баг. В какой-то из последующих версий я его исправил.

    Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 18:28 16-08-2023
    shch_vg

    Gold Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    mvk2006

    Цитата:
    А что в File - Options - Misc - OCR mode?

    Tesseract, но это никак не влияет, т.к. в моих безтессерактных заданиях стоит то же самое.

    Цитата:
    нет ли символов в protected chars (Exclusive Page options - вкладка protect) ?

    Это я просто не нашел, что и где?
     
    Все свелось к кнопке special... на закладке Page.
    Там на закладке Protect пришлось убирать все галочки слева, после чего обработка заработала.
     
    Добавлено:
    bolega

    Цитата:
    В какой-то из последующих версий я его исправил.

    В пору уже вводить правило, чтобы представляли работу в последнем выставленном варианте СК, а то так и будут находить старые ошибки.

    Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 19:10 16-08-2023
    Izich

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Здравствуйте,
     
    Есть тессеракт или finereader ocr уборка спеклов?
    Что после распознавания лишние спеклы не в радиусе букв автоматически убираются?
     
    И второй вопрос как как усилить убирание спеклов на всех файлах одновременно, не по файльно?

    Всего записей: 8 | Зарегистр. 01-08-2023 | Отправлено: 19:23 16-08-2023
    mvk2006



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Это я просто не нашел, что и где?

    ну кнопка special и вызывает окно "Exclusive Page options"
    P.S.
    А в чем такая сложность подключения библиотеки?  
    Это, на мой взгляд, неэффективное использование инструмента...

    Всего записей: 515 | Зарегистр. 15-10-2005 | Отправлено: 20:30 16-08-2023 | Исправлено: mvk2006, 22:03 16-08-2023
    shch_vg

    Gold Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    mvk2006

    Цитата:
    вызывает окно "Exclusive Page options"

    Не хватало еще запоминать названия всех окон программы.
     
    Добавлено:

    Цитата:
    А в чем такая сложность подключения библиотеки?  
    Это, на мой взгляд, неэффективное использование инструмента...

    А зачем это нужно, если не используется?
    Очень эффективное использование - подключить и не использовать.

    Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 22:08 16-08-2023 | Исправлено: shch_vg, 22:12 16-08-2023
    mvk2006



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    названия всех окон программы

    в названии есть информация и о назначении и о способе вызова и местонахождении. Хотя никто, в том числе и я не призывал ничего запоминать - дело хозяйское.  

    Цитата:
    Очень эффективное использование - подключить и не использовать.

    ну в данном случае для запуска, анализа заданий пользователей, которые пользуются возможностями инструмента с большей эффективностью, наличие библиотеки уже имело бы смысл.  
    Кроме того, автор может заложить в программу использование библиотеки и без ведома пользователя в самых разных случаях. Ну а уж демонстративно отказываться от использования возможностей инструмента, причем в большинстве своем добавленных по просьбе пользователей, на мой взгляд неразумно, хотя каждый волен сам решать за себя. Я же всего лишь спросил в чем трудность подключения библиотеки, но получил в ответ насмешку...  

    Всего записей: 515 | Зарегистр. 15-10-2005 | Отправлено: 22:57 16-08-2023
    asku



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Добрый вечер.
    Подскажите пожалуйста. Сделал picture-зону (600 dpi, Color: B/W), указываю, что фон красный, а текст белый, но на выходе буквы красные, а фон белый.
     

     
    https://disk.yandex.ru/d/NZj-ZphEPZrqYg
     

    Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 23:27 16-08-2023
       

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

    Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
    Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru