Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня тут идея возникла, просьба только сразу в штыки не воспринимать.
 
Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам ?
Если да, то каковы должны быть требования к этому файлу ?

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 07:14 25-04-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Можно ли научить СК импортировать некий файл  

Можно

Цитата:
Если да, то каковы должны быть требования к этому файлу

Текстовый файл в произвольном формате. xml не желателен, но не критично
 
 
Добавлено:
daa2013

Цитата:
при драфте все резаки ставятся вертикально/горизонтально.  и я задолбался их наклонять вручную.

А так ли это нужно? Я вот с этим не заморачиваюсь. Если из-за сильного наклона верт. резак не может отрезать всю грязь, то и фиг с ним. Контур может определиться неверно, но так как из-за финализации контур можно всегда подкорректировать  вручную после обработки, я так и делаю.
В драфте определять наклон резаков у меня не получилось, оказалось архисложно.
По хорошему, для этого нужно определить skew (а с этим у СК бывают проблемы даже после обрезки, а что уж говорить об исходном скане). В свою очередь, чтобы определить skew, нужно сперва разрезать. Напоминает СТ, не правда ли?
В СК и СТ по разному работает поиск контента. В СТ детектируется грязь на краях, затем она удаляется и получается по сути готовый контент, т.к. к этому моменту страница уже подверглась deskew. В СК задача сложнее: нужно не удалять грязь, а всунуть резак между грязью и контентом. Я скажу, что это гораздо сложнее, чем просто детектировать и удалять грязь. Если бы грязь можно было удалять, задача намного бы для СК упростилась, но к сожалению это делать нельзя.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 09:48 25-04-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
насчёт импорта координат. как я понял, имя файла зон должно совпадать с именем графического файла где эти зоны, а внутри просто перечисление вершин с переводом каретки на каждую новую зону? И это всегда полигональная зона получится? Ну, классно. Ещё опционально в конце подхватывать ссылку на номер зоны-образца, откуда свойства брать, и было бы весьма неплохо.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 10:08 25-04-2019
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поэтому сильно удивился, что в 6.41

 
А где сейчас новые версии выкладываются?
 
Насчёт расстановки резаков - в большинстве случаев работа с рамкой страницы была бы быстрее.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 10:26 25-04-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
имя файла зон должно совпадать с именем графического файла где эти зоны

Можно по всякому. Можно в один файл все записать, впереди каждой порции зон писать имя файла-скана, к которому зоны относятся. Порции отделять тэгами какими-нибудь. Можно для каждого скана свои файлы-описания зон делать. Программно можно любой вариант переварить. Главное, чтобы бы была однозначность и возможность пакетной обработки

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 10:48 25-04-2019
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам?
Вы подразумеваете использование данных из FR? Там вроде бы информация о зонах хранится в доступном виде в xml, но вопрос не изучал. Вот картинка с их сайта:
 
   
https://abbyy.technology/en:features:ocr:xml

Всего записей: 332 | Зарегистр. 10-08-2018 | Отправлено: 14:01 25-04-2019 | Исправлено: Archivist, 14:02 25-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В проекте есть более светлые и более темные страницы.
 
Порог бинаризации Авто это видит, но уровень выставляет неточный.
Хотелось бы иметь возможность выделить группу страниц, у которых порог авто дал определенное значение, и назначить им другое.
 
Т.е. добавить в едит - селект груп - спешиал    опцию  "значение параметра бинаризации после авто".
 
PS
Сначала хотел попросить возможность задавать порог   авто + K, но мою проблему это не решило бы, так как там уже целая формула потребовалась бы.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:38 26-04-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
А "change binarization threshold..." (ПКМ на виде бинаризации) вас не спасает? Там и галки отбора, и условия есть.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 06:51 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну да, это оно и есть. Просто т.к. новая фича, не знал про неё.
 
Хотя в случае выделения страниц в списке, я мог бы лишний раз по ним пробежаться, чтобы проверить, они на самом деле темные/светлые или нет.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:56 26-04-2019 | Исправлено: daa2013, 06:59 26-04-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
т.к. новая фича

внимательно и целиком читайте what's new

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 07:07 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да уж слишком оно большое.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 07:09 26-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 (ПКМ на виде бинаризации) вас не спасает?  

 
не совсем спасает. Для самых бледных я бы адаптивный  highdark назначил, а там такой возможности нет.
А если было бы выделение, то я мог бы и soft, и  highdark задействовать. Хотя и его, видимо, можно как-то в это окошко воткнуть.
Или я мог бы на всех бледных автолевелы включить. (хайдарк мне не помог, а автолевел помог.)
 
Добавлено:
ПКМ на ячейках в этом окне ("change binarization threshold...") содержит команды  "управляющие символы Юникода", наверное их надо как-то отрубить ?

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 01:06 27-04-2019 | Исправлено: daa2013, 02:10 27-04-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Попробовал заюзать в VR кнопку изменения глубины цвета страницы. Перед этим сделал original-зону, постеризовав её до трех цветов, включая белый и чёрный. Слил зону со страницей. Закрыл/открыл СК (6.41). Выбрал на кнопке режим "4 bit", потом щёлкнул на ней. Галки на White и Black in palette - стояли включённые. Save сделал. Посмотрел, что сохранилось в папке. А там у файла в палитре (причём 8-битной, судя по info) нет белого, цвет 248-248-248.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 09:46 30-04-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
6.41
 
когда прерываю задание, не задает вопрос "хотите ли потом продолжить"
и соответственно не позволяет потом запустить прерванное

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 04:45 01-05-2019
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Помогите, пожалуйста подобрать нормальные опции. Результат на выходе меня совсем не может удовлетворить. Пробую и так и эдак. /
 
Прилагаю архив test.
 
Ссылка

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 09:51 01-05-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
Помогите, пожалуйста подобрать нормальные опции

А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 13:32 01-05-2019
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".

 
Ну я думал из исходного варианта можно было бы выжать больше. Чтобы буквы были более гладкие, шума поменьше.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 10:25 02-05-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
вопрос: как идеологически верно работать с кнопочками preview на закладке Quality? Я никак не могу уловить систему использования. Какие-то фильтры применяются к окну preview немедленно по галке Enable, какие-то применяются к выделению на оригинале, какие-то параметры не оказывают видимого влияния (а хотелось бы понять, с чего это! например auto-levels на Contrast-закладке, там ещё своя кнопка превью), а в целом результат обработки обычно и близко не совпадает с видами preview-окна или выделенного куска. Может, я не учитываю, мысленно, применение порога бинаризации? Помогите разобраться. Возился с примером от asku.

Всего записей: 3061 | Зарегистр. 15-07-2010 | Отправлено: 12:47 04-05-2019
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня из теста от asku вот так вышло https://dropmefiles.com/jNtFZ

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 16:08 05-05-2019 | Исправлено: allo04, 16:09 05-05-2019
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Закрыл/открыл СК (6.41)

 
Где вы все их берёте?
по поводу сплита - его, по идее, вместе с разворотом лучше добавить в (ре)импорт, оставляя возможность переразбить страницу позже.
 
 
какие-то глюки в 5.96 - прогоняешь со стандартными настройками - проверяешь, видишь неверно исправленный перекос - снимаешь галку - переделываешь пол-страницы - ничего не меняется - галка возвращается обратно....
Аналогично с исправлением позиции резака - сдвигаешь с чёрного поля, прогоняешь еще раз - снова картинка с полем

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 18:09 05-05-2019 | Исправлено: niccolo, 19:15 05-05-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru