Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
"Не корысти ради..."
1. при формальном увеличении с 300 до 600, размер увеличивается квадратично, а не линейно, т.е. в 4 раза.  
2. можно сравнить этот учебник по геометрии, какие фильтры в WinDjView помогут?
_http://infanata.ifolder.ru/7505172
_http://rapidshare.com/files/2608812/geometrya.rar
3. помнится, смотрел Ваш скан книжки про атомные тепловозы, по мне, качество было среднее, опять же, никакие фильтры в WinDjView это уже не исправят, не говоря уж если распечатать, там глаза сломаешь.  
4. плохие сканы - могила исправит, а не фильтры в WinDjView.
5. не надо людей толкать на кривое сканирование, а то потом никакие фильтры в WinDjView уже не спасут.
6. при применении инструкции, идет комплексное использование возможностей кромсатора, и никакие фильтры в WinDjView не порежут страницы, не выровняют их, не отбросят автоматом большую часть грязи, а максимум размоют текст на экране.

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 14:44 30-07-2008 | Исправлено: VadimirTT, 14:46 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Я обработал группу 400 dpi grey-сканов до 600 dpi grey (с применением Blur и Sharpen).  

В инструкция ScanAndShare речь идет о 300dpi исходниках. И это важно! Во-первых, результат получается как будто сканировали на 600, а во-вторых, сами знаете, каковы затраты времени при сканировании на 300 и 600. Никто особо не исследовал, насколько метод хорош для 400dpi, ведь 400 - это уже само по себе неплохо.
И конечно же,VadimirTT прав в том, что исходный размер увеличивается квадратично, а не линейно, а выходной после обработки - всего лишь линейно

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 15:12 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я лишь хотел установить факт - увеличивается ли размер DjVu по этой методике, и, если да, то насколько/во сколько раз.
bolega

Цитата:
а выходной после обработки - всего лишь линейно

Т.е. размер DjVu увеличивается примерно в 2 раза - после такой обработки с 300 на 600 - я правильно понял? Об этом в ScanAndShare не сказано ни звука. Я не говорю, что эта методика плохая. Читабельность действительно резко улучшается. Я лишь пытаюсь понять, стоит ли улучшение читабельности 2-х-кратного роста DjVu-файла. Скорее всего, не всегда.
VadimirTT

Цитата:
по мне, качество было среднее,

По мне - тоже. Там были бледные малоконтрастные сканы - книжка старая. Но мне попадались ЧБ-DjVu-300-учебники 2005-2006 годов - идеально-читабельные, с приятными на вид жирненькими буквами.

Цитата:
4. плохие сканы - могила исправит, а не фильтры в WinDjView.

Сравните изображение серых сканов в СК с включённым и с выключенным фильтром.
 
Добавлено:
bolega
Что такое Create sub-task и Create out-task в 5.91?
 
ИМХО для нормальной работы по методу разделённых сканов нужно следующее от СК:
 
1. Внутри выходной папки "out" создавать вложенную папку (например, "split_scans"), куда переместить по окончании работы из папки "out" пары разделённых сканов и отдельно-вырезанные картинки.
 
2. В папку "split_scans" клать task-файл "split_scans.spt", содержащий следующую информацию:
 
- имена и количество файлов в папке "split_scans".
- координаты отдельно-вырезанных картинок на тех сканах, откуда эти картинки были вырезаны.
 
И чтобы можно было повторно открыть СК 5.91, выбрать "split_scans.spt", и произвести слияние картинок с белыми фонами, равными по размеру исходным цельным сканам (опция Create separate files for non-bw zones) - для МРС.
 
Всё это нужно для того, чтобы можно было во внешних программах обрабатывать раздельно как отдельно-вырезанные картинки, так и те ЧБ-сканы, откуда эти картинки были вырезаны.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:04 30-07-2008 | Исправлено: monday2000, 16:17 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Странная у вас логика, хотите установить факт, но берете не 300 dpi, как в инструкции, а 400 (кстати, неизвестно еще, это оптическое разрешение или интерполированное сканером). Берете не 10-20 книг, как требуют законы статистики, а всего лишь одну, и в результате рождаете очередную непроверенную "истину"
Так почему все-таки избрали 400dpi-скан? Откройте тайну, ведь в море сканов это можно сказать уникальный случай использования такого dpi. Не кажется ли Вам, что для установления закономерности избрали самый неподходящий и самый нетиповой пример.

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 16:16 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
У меня поломался сканер. А сканы я взял, какие были (400). Разрешение - оптическое. Одного опыта - мало, но для грубой прикидки достаточно. Надеюсь, кто-нибудь ещё проделает такой опыт.
 
Добавлено:
Ещё раз: в ScanAndShare ни звука не сказано о том, растёт ли DjVu файл от такого апсемплинга, и если растёт - то насколько. В этом и ошибка - такие вещи следует писать обязательно - чтобы люди могли выбирать, применять ли такой приём, или нет. Книга размером то ли в 6 МБ, то ли в 12 МБ - согласитесь, есть разница.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:25 30-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
дело не в защите кромсатора или методики или еще чего, но уже давно можно считать за постулат, что поползновения делать сканы в 300 (как и в 400), а также пропаганду того, что могут быть случае когда и так сойдёт, нужно выжигать каленым железом и никаких дискуссий тут даже и допускать нельзя, т.е. положил ноги на стол - получи ложкой полбу.

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 16:33 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
уже давно можно считать за постулат

Это, мягко говоря, не совсем корректная ИМХО точка зрения. Так давайте тогда вообще в Pdf сканировать - он же популярнее DjVu. Лучше подумать о том, как всё делать на 300dpi и получать хорошее качество при этом. Не нравится 300 - давайте 400. Но 600 - это уж слишком - для общего-то случая. Цена 600-ста слишком велика получается.
 
ИМХО 600 годится только для паршивых исходных сканов. Если сканы хорошие - то и 300 сойдёт (естественно, при грамотной обработке).
 
Вы тут себя бейте ложкой хоть по лбу хоть по другим местам - а людей Вы этим не заставите апсемплировать 300 -> 600 - ведь большинству, разумеется, не захочется это делать за счёт 2-х-кратного роста размера DjVu - это ежику ясно.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:41 30-07-2008 | Исправлено: monday2000, 16:45 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что такое Create sub-task и Create out-task в 5.91?  

Ответ был на предыдущей странице или около того
 

Цитата:
Всё это нужно для того, чтобы можно было во внешних программах обрабатывать раздельно как отдельно-вырезанные картинки

Ничто не запрещает обрабатывать файлы зон во внешних редакторах, для этого не нужно изменять их имена. Не должно быть только изменения их размера.  
В моей, внутренней, версии есть такая фича (автоматич. подмена внешних зон на другие файлы, даже с другим размером), но этой фичи в публичной версии нет (из-за отсутствия спроса на нее)
 
Кстати, в опциях sk и сейчас есть опция "удалять pic-файлы после слияния". По умолчанию она отключена. Это то, о чем Вы просили ранее

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 16:55 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Вот представьте, у меня уже есть в СК 5.91 покромсанные ЧБ-сканы с Picture-зонами. И я хочу их все скопом пропустить через BR 4.1 - выпрямить искривленные строки. Я же не могу в BR 4.1 напрямую загрузить out-папку - прийдётся сначала вручную убрать из out-папки вырезанные картинки. А потом обратно вставить. И при этом не выкидывать исходные сканы, из которых всё это было накромсано (а то spt-файл не откроется), хотя зачем они уже нужны. Что же делать? Всё руками перемещать туда-сюда?
 
Добавлено:

Цитата:
Кстати, в опциях sk и сейчас есть опция "удалять pic-файлы после слияния".  

Она не работает.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:01 30-07-2008 | Исправлено: monday2000, 17:08 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ведь большинству, разумеется, не захочется это делать за счёт 2-х-кратного роста размера DjVu - это ежику ясно.

Большинству вообще не то что делать сканов не хочется, читать много букавок противно. А для многих предел совершенства - chm и rtf  (тьфу 3 раза).
 
Добавлено:

Цитата:
Она не работает

Работает

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 17:07 30-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Единственная причина делать в 300 это скорость сканирования, но теперь, благодаря кромсатору, мы избавлены от этого, скорость сканирования в гр.серого равна ч/б, а там несколько необременительных для человека операций и на выходе замечательный скан в 600, причем, на мой взгляд, это даже лучше, чем непосредственное сканирование в 600 ч/б за счет автоматического убирания мусора в процессе выравнивания освещенности скана и более продвинутой бинаризации.

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 17:11 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я же не могу в BR 4.1 напрямую загрузить out-папку  

Загрузите файлы, начинающиеся с "pic"

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 17:13 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Да о чём Вы вообще говорите? Я Вам о РАЗМЕРЕ пытаюсь втолковать, а Вы мне о скорости. Главный смысл DjVu - это размер. И, если мы на это решим плюнуть - тогда вообще всё обессмысливается. Давайте тогда просто покромсанные тифы распространять в PDF по 100 МБ файл - ведь это же
Цитата:
на выходе замечательный скан в 600
.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:17 30-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всё, убедили, да здравствует 96 дпи! Ура товарищи!
Кстати, я во все свои сканы ещё и OCR слой запихиваю, не обременяет ?

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 17:23 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Загрузите файлы, начинающиеся с "pic"

Так мне нужно наоборот - все, отличающиеся от начинающихся с "pic". Нельзя ли добавить в СК полный пользовательский контроль над этими вещами? Потребность ИМХО ощутимая. Какие-нибудь 3 галки типа "помещать все pic во вложенную папку", "помещать все sep во вложенную папку", "помещать все парные pic во вложенную папку". По-умолчанию все 3 категории помещать во вложенную папку - это удобно как для последующего DjVu-кодирования, так и для отдельного кодирования МРС-сканов. Я-то могу, скажем, подкорректировать DjVu Small так, чтобы он отсеивал на входе все "левые" файлы (да и FSD можно аналогично подправить) - только вот BR 4.1 уже не подправишь.
 
И 2-ое ещё раз: нужен отдельный механизм хранения информации о координатах pic-картинок на парных им "обезкартиночных" сканах. В виде spt-файла, например. И с этим spt-файлом все их и хранить - никогда этот spt-файл не выбрасывать, покуда хранятся pic и парные им. Сейчас же стоит удалить нынешний spt-файл (после окончания работы), как все привязки "pic-парные им" тем самым теряются. А сохранять нынешний spt-файл бессмысленно - он завязан на входные тифы, и на абсолютные пути ко всем файлам. Проще говоря, нет механизма архивного хранения pic-файлов и парных им "обезкартиночных" сканов - сейчас их можно хранить лишь как бессмысленную груду файлов. А подобное архивное хранение нужно для последующих промежуточных этапов обработки в сторонних программах.  
 
Добавлено:
VadimirTT
Как вариант, можно попробовать сканировать на 300 dpi grey - и попытаться применить те кореловские обработки, о которых говорил Arcand в http://abab.front.ru/CorelScan.RAR - размытие, сглаживание зазубренных контуров, и т.п. Только не делать повышающий ресемплинг! Если такой вариант окажется эффективным - то просить реализовать соотв. кореловские обработки, скажем, в Scan Tailor. Это, понятно, трудно - но не нереально.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:28 30-07-2008 | Исправлено: monday2000, 17:38 30-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
говоря, нет механизма архивного хранения pic-файлов и парных им "обезкартиночных" сканов  

Как это нет?? На это и команда create out-task. После нее исх. файлы можно выбросить. В получившемся файле можно при желании легко увидеть ко-ты картинок.
Насчет относительных путей - хорошая идея. Сделаю как опцию. Это и сейчас есть, но только для create sub-task.

Всего записей: 4466 | Зарегистр. 09-09-2002 | Отправлено: 17:54 30-07-2008
Smokeer

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
---

Всего записей: 781 | Зарегистр. 25-09-2005 | Отправлено: 21:52 30-07-2008 | Исправлено: Smokeer, 21:54 30-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Вот, провел микроэксперимент, взял идеальный случай - страница из векторного pdf, выдрал в 600 дпи, сделал ресайз в 300, обе странички пожал в djvu, разница в размере 87%, но стоит ли это того, как стала страничка выглядеть?  
_http://slil.ru/26022598
и это, повторяюсь, идеальный случай, при сканировании разница в качестве будет катакстрофически увеличиваться, в то время как размеры слегка сблизятся.
и вообще, пусть Вам не нравится кромсатор, вид из окна или того хлеще путин, это Ваше личное дело, но в вопросе 600 vs 300 не может быть компромисса, если бы это говорил кто то еще, мне на самом деле было бы пофиг, но в данном случае, пойдет писать губерния - мол сам понедельник на 300 благословил, а то что он сделал такие глубокие выводы походя клацнув пару раз мышкой на материале завалявшимся в корзинке это уже будет за скобками.
насчет всемогущего корела, который нам поможет, если запустить кромсатор, то можно понаблюдать преинтереснейшую картину, там отображается последовательность выполнения операция, вначале идет выравнивание. потом ресайз и только затем применение всех остальных фильтров, с чего бы это ?
никаких причин за 300 нет, кроме ставшей неактульной скорости сканирования, я бы никогда не стал бы страдать и сканить в 600.

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 22:22 30-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Хорошо, давайте сделаем так: пусть по-умолчанию Ваш способ будет считаться основным при создании DjVu. Всё-таки, как ни крути, хорошая читабельность - это гораздо важнее, чем возрастание размера DjVu в 2 раза. Прийдётся, видимо, пойти на такую жертву (возрастание размера DjVu) - ведь паршиво-читаемая, но зато маленькая по размеру DjVu-книга действительно годится только для OCR-ения. 300dpi в самом деле маловато - 400 ещё куда ни шло.
 
Но всё же полностью отказываться от сканирования и дежавючения на 300 dpi ИМХО преждевременно. Надо всё равно искать и исследовать пути отказа от апсемплинга. Я действительно видел качественные книги на 300 dpi - если попадётся, выложу образец. Т.е. новые книги, только что купленные в магазине, на хорошей белой бумаге (не макулатурной, а типа мелованной) и с чётким шрифтом можно пробовать делать на 300dpi - так я и буду рекомендовать народу.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:16 31-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
1. ещё раз, я не пропагандирую мой не мой способ, я за 600 дпи и никаких гвоздей.
2. может договоримся, что как только Вы выложите мифическую качественную (а не из разряда и так сойдет) книгу в 300, и народ одобрит, только после этого Вы будете начинать упоминать о гипотетической возможности делать в 300.

Всего записей: 2911 | Зарегистр. 22-03-2005 | Отправлено: 09:26 31-07-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru