Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
wasp238



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ScanKromsator. Основы автор разыскивается

Автор этого видео урока - я. Снимал лет 10 назад, потом отослал на оценку "кому-то" и они забраковали из-за длительности. Урок выкладывать не стал, и продолжение не снимал.
Что осталось, так это софт и небольшой хелп (20 стр с картинками) как я обрабатывал книги, кому надо качаем:
https://drive.google.com/open?id=1brAZ-JMcoVYpBfTWZvU12muGaWWDxN_c

Всего записей: 49 | Зарегистр. 27-10-2008 | Отправлено: 09:49 15-03-2020 | Исправлено: wasp238, 09:55 15-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всё-таки, никак не удается настроить соотношение страниц, чтобы текст с полями соответствовал остальным страницам и чтобы тексты с пустотами не смещались в ненужные стороны. Собрал в архиве выборочные страницы из проекта и сам файл проекта под них — просьба подсказать, как его правильно настроить — https://yadi.sk/d/5NHr9Yv5XJnZ6w.

Всего записей: 1368 | Зарегистр. 05-04-2010 | Отправлено: 21:35 15-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
объясните сначала свои термины. пожалуйста.
"ненужные стороны"
"соответствовал остальным"
"правильно"
Ни одного словаря на ваши термины, как я полагаю, не существует. Даль и Виноградов вряд ли помогут.
 
Возьмите листок А4, нарисуйте на нем эскизы оригиналов, и ниже - что вы хотите получить, какое равнение для каких сканов. Листок сосканьте и покажите тут. А уж потом можно будет глядеть, какие настройки делать в СК. Пока что ваше "правильно" для других сокрыто во тьме.
 
Вообще по равнению текстового блока в габаритах листа в Хрестоматии есть прекрасные тексты. И мой ролик о равнении в край может помочь, вероятно (https://youtu.be/gIhpk6bfl3w)

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 04:14 16-03-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Постом ранее было написано:
"пытаюсь отснятую на телефон книгу обработать"
 
это значит, что нужна функция автомасштабирования, которую я в лохматом 2008 году просил от разработчика СканТейлора  (он еще тогда был на стадии замысла !), и которую тот в мод  СканТейлорЭкспериментал всё-таки встроил. Именно эта прога (этот мод) заточена на обработку фотографий книг из-за наличия следующих операций:
- исправление геометрических искажений как самая первая стадия обработки;
- выравнивание страниц по вышине и высоте текстового блока путем масштабирования.
В СканКромсаторе этих функций нет.
 
 
UPDATE
Упс. Тут у вас уже другой проект.
Короткого ответа на ваш вопрос не существует. Длинный текст (Хрестоматия  - разделы 2.3, 2.4., 2.11). Вам не заходит.
Попробуйте видеоролики посмотреть.  Впрочем, мне лично макетирование страниц в СК тоже кажется сложновато устроенным. Я сначала в СТ обрезаю все страницы под один размер с правильными полями. Делаю цветной вывод. А потом уже занимаюсь бинаризацией и расстановкой зон в СК.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:53 16-03-2020 | Исправлено: daa2013, 07:09 16-03-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Кто-нибудь сталкивался с таким чудом?
На вин10 пробую к заданию импортировать пару сканов из пдф.
СК (6.0.5 и 6.41) спокойно проглатывают мой ОК и ничего не импортирует.
Пробую то же на сервер2003.
СК становится более разговорчив, выдает сообщение:

Ошибка открытия файла ХХХХХ.pdf!
Возможно файл открыт другим приложением или запаролен
Retry   Cancel

хотя кроме как из СК я с ним не вступал в контакт.
Открыл этот пдф в Nitro_PDF и без проблем вытащил тифы.
Сейчас сижу и чещу репу:
1. Что происходит с СК?
2. Почему реакция одной и той же программы (оба компа связаны по сети и стартую из одной папки) на разных системах различна?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 17:24 16-03-2020 | Исправлено: shch_vg, 17:26 16-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
1. Что происходит с СК?  

Видимо, ожидаете, что автор СК должен принести вам извинения за доставленные неудобства?
Если по делу, то много раз такое встречалось и объяснялось тут на форуме: СК не любит файлы, сделанные не по стандарту PDF. Такие файлы встречаются на практике постоянно, профессиональные программы научены обходить косяки, СК - нет. Обычно пересохранение  "неправильного" файла в акробате проф решает проблему. Если не решает - надо смотреть что не так идет в СК именно с этим конкретным файлом (баг в СК тоже вполне возможен).

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 18:33 16-03-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Видимо, ожидаете, что автор СК должен принести вам извинения за доставленные неудобства?

Интересно, из какого места моего сообщения был сделан такой вывод?
То, что в СК не все пдф импортируются, я давно знаю.
Просто с такой реакцией СК я еще не сталкивался, причем в разных системах по-разному, вот, что меня удивило.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:51 16-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Интересно, из какого места моего сообщения был сделан такой вывод

Вы ранее всегда в таких случаях давали образец файла для исследования. Сейчас ваш вопрос выглядит риторическим (и вы сами это прекрасно понимаете), просто потому, что без pdf-файла никаких выводов сделать нельзя в принципе.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 19:49 16-03-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Причина, заставившая меня написать сообщение, была не в том, чтобы обратить внимание на то, что СК не смог импортировать еще один пдф (тем более, что перезапись файла в NITRO выпрямила его), а в том, что программа повела себя неодинаково в разных системах.
Я только что начал немного работать в вин10 и не ожидал такой разницы.
Если бы она выдала что-то типа "Кривой пдф" или какую-то замысловатую (но похожую в обеих системах) ошибку, то воспринял это как должное. А то в одном случае (вин10) молча проглотила попытку импорта, а в другой (сервер2003) огорошила запароленностью пдф. Вот и все объяснение моего удивления.
В данном случае я интересовался, не сталкивался ли кто-нибудь с подобным явлением, а с конкретными кривыми пдф ранее я обращался непосредственно к Вам.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 00:57 17-03-2020 | Исправлено: shch_vg, 01:10 17-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
да, на десятке СК ведет себя странновато, не единожды отмечал. Конкретику не приведу.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 03:06 17-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Возник вопрос насчёт сохранения в PDF из SK. TIF-файлы получились 5320х8020, в некоторых случаях с отличающимся DPI. Когда сохраняю в PDF, результат получается под гигабайт размером, не смотря, что комбинировал настройки из выпадающего списка «DPI» и «Input DPI». По открытии PDF-файла он по умолчанию отображается на уровне 30%, с возможностью увеличения. Хотелось бы понять, с какими настройками получать приемлемых размеров файл?

Всего записей: 1368 | Зарегистр. 05-04-2010 | Отправлено: 05:56 17-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
а зоны у вас в задании есть? или всё чистый чб текст? Зоны могут создавать очень большой объем, особенно если как у вас - из 120дпи на входе в 600дпи на выходе. И во flate.
 
Вообще-то намного проще сделать как в шапке написано - подготовить и выложить sub-task.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 07:02 17-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Поначалу все колонтитулы на четырех ста страницах переделал в зоны. Но потом они были объединены и повторно открыты в новом задании, так что в описанном задании уже только раскрашенные колонтитулы, а зон нет. Получается, СК не подходит для создания PDF с цветным текстом, или есть какие-то оптимальные настройки по DPI для размеров 5320х8020, и другим моментам?

Всего записей: 1368 | Зарегистр. 05-04-2010 | Отправлено: 08:00 17-03-2020
abc10



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
All
Откуда можно скачать последнюю версию ScanKromsator'a?

Всего записей: 2543 | Зарегистр. 21-11-2005 | Отправлено: 08:07 17-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
А у вас точно out-файлы и раскрашенные зоны - ч/б? Размер под гигабайт говорит на 100% об обратном.  
 
Добавлено:

Цитата:
Но потом они были объединены и повторно открыты в новом задании

Вот и причина. После объединения все файлы стали цветными, поэтому и объем стал гигантский. Так делать нельзя.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 08:07 17-03-2020 | Исправлено: bolega, 08:23 17-03-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
Получается, СК не подходит для создания PDF с цветным текстом

Вы пользоваться научитесь, а СК ругать не стоит раньше времени.
 
Вы зачем колонтитулы объединили с чб текстом? Получили каждую страницу размером по 30-50 мегабайт, может и побольше. Пытаетесь запихнуть это всё в pdf - имеете гигабайтного монстра на выходе. А как иначе-то? Ну соображать же надо, когда мышкой елозите по функциям.
 
UPD
То есть вы не разбили страницы на зоны. Страницы цветные, раз с цветными колонтитулами. Соответственно, кодеру pdf неизвестно, какие алгоритмы сжатия для какой области (зоны) страницы применить. Ну и он честно пытается всю страницу ужать без потерь, или там в качественный джипег (думаю, всё-таки в тифф, а не в джипег).  
 
оффтоп
Я всё не перестаю удивляться - для кого daa2013 старался Хрестоматию пилил. Ведь там разжёвано до деталей. Получается, доки писать - вообще зряшный труд.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 08:31 17-03-2020 | Исправлено: TelecomUral, 08:50 17-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А если у меня сохранилось предыдущее задание с размеченными зонами — можно ситуацию исправить? Ведь программа может считать, будто я только что объединил зоны и опознавать их как черно-белые? Сами тиф-файлы максимум от 100 до 600 кб.
 
UPD
Вроде понял — надо Color на вкладке Files в B/W установить.
 

Цитата:
Вы зачем колонтитулы объединили с чб текстом? Получили каждую страницу размером по 30-50 мегабайт, может и побольше. Пытаетесь запихнуть это всё в pdf - имеете гигабайтного монстра на выходе. А как иначе-то? Ну соображать же надо, когда мышкой елозите по функциям.

Это как раз результат того, что соображал — ведь если программа сохраняет тифы в минимальном размере, естественно предположить, что таков их окончательный размер и он не будет расти при конвертации.

Всего записей: 1368 | Зарегистр. 05-04-2010 | Отправлено: 17:37 17-03-2020 | Исправлено: D1D1D1D, 18:10 17-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
А если у меня сохранилось предыдущее задание с размеченными зонами — можно ситуацию исправить?

Да, можно. Вы правы, нужно задать в нем Color=B/W. И во всех зонах-колонтитулах тоже не забудьте (задать в одной и скопировать этот параметр на все остальные).  

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 18:18 17-03-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
нужно задать в нем Color=B/W. И во всех зонах-колонтитулах тоже не забудьте

Имеется в виду в диалоговом окне «Picture zone properties» задать B/W — помимо Color на вкладке Files?

Всего записей: 1368 | Зарегистр. 05-04-2010 | Отправлено: 18:24 17-03-2020 | Исправлено: D1D1D1D, 18:25 17-03-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, помимо. Ведь на то они и зоны, что их опции могут отличаться от опций страниц.
Если этого не сделать, страницы в pdf будут ч/б, а зоны пойдут цветными и размер будет опять неоптимальным.
 

Цитата:
он не будет расти при конвертации.

Одна ч/б точка занимает 1 бит, одна цветная - 8 или 24 бит. Т.е. общий размер вырастет на 1-2 порядка.
Многие не понимают, как СК создает pdf с цветным текстом. Вариантов бывает два: объединить зоны со страницей и получить в итоге цветной файл (по другому никак цвет не передать!). Из цветных файлов создать огромный pdf.
Второй вариант: оставить все ч/б. СК, увидев, что для ч/б зоны задана раскраска, сделает так: поместит в pdf ч/б, т.е. 1-битный файл, и добавит специальную pdf-команду: "раскрась такой-то участок таким-то цветом".
Для djvu примерно то же самое.
 
 

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 18:39 17-03-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru