Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AlVaKo

Цитата:
Т.е. надо округлять размеры фона до целого вверх.  
Нет требования кратности размеров страниц.

Любое округление нарушает тождественность маски и фона, а правило 12 гарантирует эту тождественность.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 23:22 20-01-2020 | Исправлено: shch_vg, 23:23 20-01-2020
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обычно я придерживаюсь кратности 60-ти.  Могу без остатка еще делить на 5.  Но это для меня не догма.  
 
Допустим у страницы высота маски 4493 пикселов  при 600dpi, то у фона в 100dpi высота получиться 749 пикселов.
 
Определим, на сколько мы отклонились от "тождественности".
 
4493/6 = 748.8(3)  
100*(749 - 748.83)/748.83 = 0,02 %    
 
Для меня, в плане djvu-книжек, точность запредельная.

Всего записей: 42 | Зарегистр. 06-07-2011 | Отправлено: 13:25 21-01-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Записал ролик, как выглядит "улёт глифов" в 6.42
 
https://yadi.sk/i/759Y05HNPprsDQ
 
(по хоткею "пасте" глиф встает не в области курсора, а в некоей другой позиции на экране). При нормальной работе этого не происходит, но в какой-то момент иногда раньше (минут 5 после включения компа), иногда позже (не один десяток страниц прошел и комп пару суток стоял включенным) начинается такая ерунда.
 
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 07:35 24-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Как отключить для определенной страницы — поля-отступы и изменение цвета?

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 03:27 25-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На закладке Page кнопка special, далее галку на "ignore gaps" (типичное значение опции для обложек) и color=original, можно и dpi=original

Всего записей: 4428 | Зарегистр. 09-09-2002 | Отправлено: 10:45 25-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо!
 
Добавлено:
Интересно, по какой причине при открытии страницы в PDF-файле показываются не в 100%, а в 20-ти %? — https://yadi.sk/i/vR6zqiqSEAillQ

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 12:33 25-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
С какой настройкой можно задавать размер листа для PDF, чтобы на стандартных мониторах сто процентов показывалось без многократного уменьшения страницы?
 
Добавлено:
Тестировал на определенной странице, создавая PDF и меняя DPI, но размер листа получается огромный, а текст либо мелкий, либо большой.

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 23:24 25-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
я не специалист, поэтому мой ответ может быть неточен.
пдф считает габариты и все размерения объектов страниц в метрах (миллиметрах и т.п. дюймах). СК считает пиксели. Поэтому вы не должны "врать" при установке дпи, тогда всё автоматом сойдётся на экране просмотрщика. Если у него спецнастроек, перекрывающих файл, не установлено.
Допустим, исходный скан по линейному пиксельному(!) размеру 2300пкс. Это для среднего формата книг (20-21см), выходит, было сосканено в 300дпи. (расчет: 300dpi делим на 25,4мм получаем 11 точек на миллиметр, множим на высоту выходит 2480 пикселей).
Если сканер "правильный" и дпи в скане сохранил, то СК опознает его.
Вы в СК пишете выходной дпи = 600, тогда на выходе будет примерно 4600 пикселей, плюс-минус поля.
При изготовлении пдф габариты страницы будут рассчитаны и записаны в файл пдф как 4600/600*25,4 в миллиметрах. То есть 194,7мм.
 
Я сейчас взял и проверил это на одном своем файле: в pdfxchangeviewer в углоке проставлена верная информация о габаритах 10,97х19,05 см. При этом оригинал (в 300дпи) имел число пикселей 2405х3066 разворотом, поля я поставил 70пкс. ЧБ-страница вышла в СК 2592х4500пкс.
 
Все сложности начинаются вот тут:
 

 
Когда в скане не записана информация о дпи, рассчитать "метры" невозможно. Неизвестен коэф.пересчёта из "точек"-пикселей в линейный/физический размер.
 
И не забывайте, что у вьюверов может быть установлен принудительный масштаб:
 

 

Всего записей: 3045 | Зарегистр. 15-07-2010 | Отправлено: 05:22 26-01-2020 | Исправлено: TelecomUral, 05:32 26-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Все верно TelecomUral описал. В pdf у вас файлы имеют 300dpi, хотя на самом деле они где-то 1200dpi, обложка - 90 dpi, а на самом деле 600dpi.
Исправить можно так: в задании, в котором делаете pdf, на закладке Files задайте inputdpi=1200 и снимите галку с only for uknown (обязательно!).
Запустите обработку и получите уже корректный pdf. Кроме обложки, т.к. для нее надо было не 1200, а 600. Но опция работает для всех.  
Чтобы обойти это ограничение, придется вместо inputdpi прописать в файлы правильное dpi. Это делается командой меню Tools > Correct dpi. В этом случае inputdpi трогать не надо.

Всего записей: 4428 | Зарегистр. 09-09-2002 | Отправлено: 08:52 26-01-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно и сам PDF от D1D1D1D причесать т.к. разрешение в пикселях там запредельное.
Оптимизированный:Training in indexing 1969

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 14:11 26-01-2020 | Исправлено: ComboFZ, 14:12 26-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Уважаемый, а вы из SK получили PDF 9 мегабайт, или после оптимизировали?
 
Добавлено:
Интересует, как точно установить DPI для страницы по ссылке, и корректно задать ей в нужном месте DPI? — https://yadi.sk/d/OWGAexUVohj0IQ
 
Смотрел DPI в IrfanView, там показано, что DPI = 1.

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 15:08 26-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
никак. нужно знать высоту книги, например (в выходных данных есть запись типа 84х108 1/8). На каталожной карточке пишут прямо сантиметры, чтобы потом на правильный стеллаж отправить в хранение. Или сфоткать линейку на фоне букв. Или монетку положить. А просто лист - не к чему привязать. Я же писал выше - коэффициент пересчета неизвестен.

Всего записей: 3045 | Зарегистр. 15-07-2010 | Отправлено: 15:48 26-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Такого плана сканы могут быть для возможности определения размера? — https://yadi.sk/d/_yaO18fSZSX58A

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 15:56 26-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
ну да.  
что угодно, что дает "в этом числе пикселей картинки столько-то миллиметров". но если это фото с рук или с плавающим фокусным расстоянием объектива - то на каждом фото такой объект должен быть.

Всего записей: 3045 | Зарегистр. 15-07-2010 | Отправлено: 16:04 26-01-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А когда размер текста меньше страницы — это признак того, что DPI указано меньше, или больше?  

Всего записей: 1366 | Зарегистр. 05-04-2010 | Отправлено: 20:22 26-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
или это признак того, что не пересчитаны размеры на закладке Book. Меню Process\Calculate book size

Всего записей: 3045 | Зарегистр. 15-07-2010 | Отправлено: 20:29 26-01-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
вы из SK получили PDF 9 мегабайт, или после оптимизировали?

После.
 

Цитата:
Интересует, как точно установить DPI для страницы по ссылке, и корректно задать ей в нужном месте DPI? — https://yadi.sk/d/OWGAexUVohj0IQ

DPI (если нет данных или они неверные) можете узнать в FineReader 14 > Редактировать изображение > Разрешение изображений > Другое: (покажет 330dpi).
На кнопку Определить оптимальное разрешение там не надо нажимать.
 
Поправить/установить DPI на снимках/сканах (без пересжатия оных) можете в ExifTool

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 12:43 27-01-2020 | Исправлено: ComboFZ, 14:59 27-01-2020
mmordk1

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Простой вопрос : какие опции ставить, чтобы собрать ГиФ файлы в ПДФ без потери в разрешении?
 
Спасибо

Всего записей: 5 | Зарегистр. 18-06-2019 | Отправлено: 20:46 31-01-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
mmordk1
Закладка File параметр DPI=Original.
 
P.S. Правда я не встречал гифы с указанным DPI.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 21:04 31-01-2020 | Исправлено: shch_vg, 21:09 31-01-2020
niksad31

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
В СканКромсаторе есть инструмент Background cleaner. Чаще всего прекрасно справляется. За подробностями в соответствующую ветку.
Цветную ручку можно и в графредакторе, наверное, удалить, а вот карандаш - разве только по яркости.

 
Извини, не могу выложить примеры страниц книги, она ДСП по спецтематике. Но подчёркивание простым карандашом и синей ручкой самое обычное от руки, в любых справочниках такое встречается. Только я книгу отсканировал как чёрно-белый текст в PDF с очисткой фона сканером. Но подчёркивания все остались.
 
Попробовал вкладку Background Cleaner, но она совсем ничего не изменила. Я со СканКромсатором незнаком, что-то делаю не так. Вы не могли бы на примере любой страницы книги показать?
 
В графредакторе врядли осилю вручную чистить, книжка слишком толстая, и сильно замарана пометками. Хотелось бы конечно. Нашёл в сети ветку по нейронным сетям, вроде как к месту, но разраб код нифига не выложил, хотя просили.

Всего записей: 746 | Зарегистр. 16-09-2016 | Отправлено: 09:28 10-02-2020 | Исправлено: niksad31, 18:04 10-02-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru