Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Первая сборка с регулируемым деспеклом: http://www.onlinedisk.ru/file/371938/
Регулировку не стал делать плавной (трудно сбалансировать параметры), а вместо этого сделал три уровня плюс четвертый - отключено.  Планируется сделать еще пару улучшений, не связанных с качеством удаления пятен, а в остальном все уже имеется.
 
Прошу потестировать и сообщать случаи, когда на крайних режимах (не считая отключенного) не удается достичь желаемого эффекта.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:36 08-03-2010
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Правильно ли я понимаю, что красным обозначаются зоны удаления контента? Если так, то...
Самый жесткий уровень делает губительные ошибки. Причем на страницах содержания удаляет не точки (беда прежнего алгоритма), а текст.
Tulon
Просто интересно, а изначальный алгоритм какому из нынешних уровней очистки соответствовал? Или их теперь сравнивать уже нельзя?
 
Добавлено:
Мда... Dewarp создает причудливые формы на выходе ))). Да, знаю, что он в сыром виде.
Ожин раз программа вылетела. Но, думаю, это по моей вине: нажал на вывод, прога стала обрабатывать скан, а я сразу нажал Dewarp. Если повторится - извещу.
Tulon
Спасибо за деспекл! По предварительному тестированию средний уровень хорошо справляется. Будем тестировать дальше... на рабочих материалах.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 01:14 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Правильно ли я понимаю, что красным обозначаются зоны удаления контента? Если так, то...
Самый жесткий уровень делает губительные ошибки. Причем на страницах содержания удаляет не точки (беда прежнего алгоритма), а текст.  

Ну так давайте примеры.  Может там DPI неправильный или еще чего.  А если ничего такого, то можно и параметры подкрутить.  Для этого собственно говоря и прошу тестировать.
 

Цитата:
Просто интересно, а изначальный алгоритм какому из нынешних уровней очистки соответствовал? Или их теперь сравнивать уже нельзя?  

Было сделано два изменения в алгоритме, из-за которых точного соответствия уже не получится.  В частности, близость по горизонтали теперь ценится больше, чем  по вертикали.
 

Цитата:
Мда... Dewarp создает причудливые формы на выходе ))). Да, знаю, что он в сыром виде.
Ожин раз программа вылетела. Но, думаю, это по моей вине: нажал на вывод, прога стала обрабатывать скан, а я сразу нажал Dewarp. Если повторится - извещу.  

Dewarp я в релизе вообще отключу, иначе меня задолбают баг репортами.
Падать не должна, даже в таком случае.  В этой сборке я отключил обработчик падений, но если надо - включу в следующей.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:45 08-03-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
По поводу Dewarp'а:  алгоритм в том виде в котором есть сейчас будет давать искажения на страницах типа содержаний, т.к. вертикальное положение центра тяжести букв и отточий изначально различаются.  
Самый простой выход могу предложить такой: в cc_box поудалять слишком маленькие прямоугольники, соответствующие точкам,  запятым и т.д. Т.е. вообще не учитывать их при расчете линии строки.

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 02:42 08-03-2010
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Ух! Спасибища! Главное неудобство для про-обработки, учтено! Всё, можно подработать свои запасы.
 
Добавлено:
Благодарность Вам от имени Infanata! Вас там очень ценят. И ваши разработки.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 03:20 08-03-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо за ваш труд!
 
1. Даже в смешанном режиме картинка на вкладке depesking остается битональной, и находит точки для удаления в области автозоны.
2. Чтобы разглядеть удаленную песчинку на фоне depesking-пятна приходится сильно увеличивать масштаб, почему бы не рисовать ее черной?
3. Мне одному кажется очень странной пустая кнопка? Может быть, все-таки чекбокс + ползунок на три положения? Сейчас с учетом кнопки Применить панель Depeskling выглядит несколько громоздко..
4. Не забудьте поправить заголовок окна "Применить к.."

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:45 08-03-2010 | Исправлено: StanFreeWare, 08:50 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Даже в смешанном режиме картинка на вкладке depesking остается битональной, и находит точки для удаления в области автозоны.  

Деталь реализации.  Возможно в релизе сделаю смешанный вывод.
 

Цитата:
2. Чтобы разглядеть удаленную песчинку на фоне depesking-пятна приходится сильно увеличивать масштаб, почему бы не рисовать ее черной?  

Представьте, что две песчинки были рядом и одна удалилась, а другая нет.  В этом случае пятно от удалившейся покроет и оставшуюся, но оставшаяся останется черной.  Можно попробовать и другие способы повышения разборчивости удаленных объектов, например сделать пятна бледнее.  На практике однако очень редко нужно смотреть, а что именно там удалилось - достаточно издалека взглянуть, где оно было и какой размер имело.
 

Цитата:
3. Мне одному кажется очень странной пустая кнопка? Может быть, все-таки чекбокс + ползунок на три положения? Сейчас с учетом кнопки Применить панель Depeskling выглядит несколько громоздко..  

Изначально было с ползунком, но получилось, что три кнопки - гораздо удобнее эргономически.  А насчет пустой кнопки - можете нарисовать перечеркнутый веник, или что-то еще.  Сам то я рисовать не умею.
 

Цитата:
4. Не забудьте поправить заголовок окна "Применить к.."

OK
 
Добавлено:
U235

Цитата:
По поводу Dewarp'а:  алгоритм в том виде в котором есть сейчас будет давать искажения на страницах типа содержаний, т.к. вертикальное положение центра тяжести букв и отточий изначально различаются.  
Самый простой выход могу предложить такой: в cc_box поудалять слишком маленькие прямоугольники, соответствующие точкам,  запятым и т.д. Т.е. вообще не учитывать их при расчете линии строки.

Учту.
 
Добавлено:
VidelSamogO
Спасибо за позитив.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:57 08-03-2010
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Первая сборка с регулируемым деспеклом: http://www.onlinedisk.ru/file/371938/

у меня под WS2008, к сожалению, после загрузки файлов вылетает.
 
Пока не разбирался, времени вчера не было.
Может быть проблема и у меня. Чего я туда только не установил.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 13:46 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olive77
Вечером выложу сборку с краш репортером.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:28 08-03-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
1. Дело не только в смешанном выводе - а в том, что, повторюсь, в автозоне ищутся и находятся песчинки..
 
2. Перечеркнутый веник никак не впишется. Да и неясно, какого размера брать размер веник для перечеркивания.  
В данном случае оптимум - это, imho, чекбокс + три кнопки (неактивные при выключенном чекбоксе). Такое решение уже привычно по панели Выравнивание этапа Макет страниц. Плюс уйдет ненужный дребезг границ кнопок (воспринимаемый как неряшливость) из-за того, что ширина кнопки Применить примерно равна ширине двух кнопок с веником.
 
Добавлено:
А примерно, в сравнении с типографской точкой чему каждый веник соответствует?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:20 08-03-2010 | Исправлено: StanFreeWare, 16:27 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчерашняя сборка, только с краш репортером: http://www.onlinedisk.ru/file/372680/
 
StanFreeWare

Цитата:
1. Дело не только в смешанном выводе - а в том, что, повторюсь, в автозоне ищутся и находятся песчинки..  

Это не важно.  Зона, в которой они находятся, все равно накроется картинкой.  В общем не беспокойтесь на этот счет, а подождите до релиза.
 

Цитата:
2. Перечеркнутый веник никак не впишется. Да и неясно, какого размера брать размер веник для перечеркивания.  
В данном случае оптимум - это, imho, чекбокс + три кнопки (неактивные при выключенном чекбоксе). Такое решение уже привычно по панели Выравнивание этапа Макет страниц. Плюс уйдет ненужный дребезг границ кнопок (воспринимаемый как неряшливость) из-за того, что ширина кнопки Применить примерно равна ширине двух кнопок с веником.  

Мне все же четыре кнопки в ряд больше нравятся.
 

Цитата:
А примерно, в сравнении с типографской точкой чему каждый веник соответствует?

Это не просто фильтр по размеру, там все сложнее:
Есть верхний предел по размеру, достигнув которого объект определенно удален не будет.  Он достаточно высок, с таким расчетом, чтобы буквы его достигли, а пунктуация и другая мелочь - нет.  Ну а дальше строится такая модель:
Объект может удерживать другой объект, если тот не сильно большой и не сильно далеко.  Тот в свою очередь тоже может удерживать другие объекты.  Потом для каждого объекта проверяем, есть ли в цепочке его удерживающих объект, достигший верхнего предела по размеру.  По аналогии с небесными телами в общем.
 
Добавлено:
Olive77
Падает при попытке использовать OpenGL.  Возможно связано с новой версией Qt.  Может быть 3D ускорение тоже стоит в релизе отключть - больше проблем от него чем толку.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:02 08-03-2010
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Может быть 3D ускорение тоже стоит в релизе отключть

Так Вы же вроде давно его отключили в настройках по-умолчанию. Снова вернули? ИМХО, лучше отключить

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:16 09-03-2010
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Падает при попытке использовать OpenGL.  Возможно связано с новой версией Qt.  Может быть 3D ускорение тоже стоит в релизе отключть - больше проблем от него чем толку.

Так и есть.
Правда в начальных версиях использующих 3D ускорение проблем не было.
 
На выходных потестю с пристрастием.
Спасибо за новую версию.

----------
Believe it or not, every fool you meet is the end result of millions of years of evolution.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 00:35 09-03-2010
Mandor Sawall

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчера вечером попробовал на маленкую книжку (80 стр.) – все на самый сильный деспекл. Только на одну страницу удалила три тире – вот на ету (левый разворот).
Мои заметки:
1. По моему, даже самый сильный деспекл немножко недостаточен. На одну страницу заметил пятно, которое входит в квадрат 3х3 пикселя.
2. Почему-то настройки деспекля не записываются в проект. Каждий раз после загрузки проекта начинает с средный режим.
3. Если на страницу нет контента (пустая страница), закладка Despecle вылетает с ошибкой.
Кстати, болгарский перевод еще старый – с множество опечатками. Пожалуйста, не выпускайте релийз с етим переводом.
 
Надеюсь, что внятно обяснил (словарь у меня бедный…)
 
Добавлено:
Да, и еще – что думаете о возможность удалять (запрещать) конретний деспекл через правый клик на красные пятна?

Всего записей: 119 | Зарегистр. 20-03-2003 | Отправлено: 09:55 09-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Так Вы же вроде давно его отключили в настройках по-умолчанию. Снова вернули? ИМХО, лучше отключить

Я имел в виду что лучше его совсем убрать.  Еще не встречал человека, у которого эта фича не просто работает, а работает лучше чем режим по умолчанию.
 
Mandor Sawall

Цитата:
1. По моему, даже самый сильный деспекл немножко недостаточен. На одну страницу заметил пятно, которое входит в квадрат 3х3 пикселя.  

Значит оно совсем близко от чего-то более крупного.
 

Цитата:
2. Почему-то настройки деспекля не записываются в проект. Каждий раз после загрузки проекта начинает с средный режим.
3. Если на страницу нет контента (пустая страница), закладка Despecle вылетает с ошибкой.  

Вечером посмотрю.
 

Цитата:
Да, и еще – что думаете о возможность удалять (запрещать) конретний деспекл через правый клик на красные пятна?

Пока нет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:18 09-03-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Возможно, следует сделать (в отдалённом будущем) возможность вращения зон (авто- и пользовательских).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:46 14-03-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Не представляю, зачем  поворачивать картинки отдельно...?
Есть реальный пример такого скана, где это необходимо?

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 01:25 15-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Второй пререлиз версии 0.9.8: http://www.onlinedisk.ru/file/378694/
 
Теперь планирую исправить пару мелочей и посмотреть, нет ли мест, где легко можно поднять производительность.  Потом, если к тому времени не пропадет желание, спрошу здешних форумчан на предмет того, какие еще мелочи стоит исправить к релизу.  А сам релиз будет через пару недель.
 
Dewarp и 3D ускорение, которое до сих пор падает, я в релизе уберу.  В этой сборке и то и другое еще есть.
 
Кстати до сих пор мне не предоставили ни одного примера, где деспекл работет сильно плохо.  Если есть такие примеры - выкладывайте пока не поздно.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:28 15-03-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
какие еще мелочи стоит исправить к релизу

Если будет возможность -- можно увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 04:13 15-03-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Не представляю, зачем  поворачивать картинки отдельно...?

Для взыскательных сканировщиков, думаю.

Цитата:
Есть реальный пример такого скана, где это необходимо?

Под рукой нет, но изредка бывала такая нужда. Типичный пример - повернули скан по Deskew - а картинки после этого просятся, чтобы их ещё чуть крутануть - до точно горизонтального положения. Это, конечно, на сканах не самого хорошего качества (скажем, неравномерно от верха к низу по вертикали - "гнутых" или "раздутых").

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:36 15-03-2010 | Исправлено: monday2000, 11:38 15-03-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru