Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Игнор-лист для RuBoard под браузеры FireFox, Chrome, Opera  
Не нравится кто-то - просто введите его в игнор, чтоб глаза не мозолил, вот и всё.
Скрипт

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 14:37 17-02-2010 | Исправлено: ndch, 12:35 25-08-2016
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Категорически необходим пункт меню, позволяющий "не определять зоны картинок автоматически" для режима "смешанный". На случай неверного их определения.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 02:02 18-02-2010 | Исправлено: VidelSamogO, 02:54 18-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO
Согласен, но скорее в такой форме. Вряд ли сейчас (с тремя параллельными ветками проекта) ответ Tulon'a станет другим. Хотя мне кажется, что реализация предложения даже упростит внутреннюю структуру ST.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:51 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Полезная область:
Допустим, в этой стадии вручную найти и привязать полезную область к ИП, привязать к номеру страницы

далее сказать, ОБУЧИСЬ, привяжи оставшиеся страницы по углу; запомни габариты ИП для вывода к масштабу 100% относительно ширины строки

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 14:39 18-02-2010 | Исправлено: Dashout, 14:59 18-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
далее сказать, ОБУЧИСЬ, привяжи оставшиеся страницы по углу; запомни габариты ИП для вывода к масштабу 100% относительно ширины строки

ОЧЕНЬ абстрактно и как следствие бесполезно.  Одно слово "обучись" чего стоит!  Кроме того, напоминаю, что фич-реквесты продолжают игнорироваться.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:04 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
уважаемый Tulon, лишние слова
Все что не входит в логику реализации Вашей модели будет по определению

Цитата:
абстрактно и как следствие бесполезно

 

Цитата:
фич-реквесты продолжают игнорироваться

как угодно
 
 
 
 
Добавлено:
хотел пояснить - говорю не со зла
в принципе я понимаю эту позицию, возможно в данном случае (один разработчик на такой объем работ) она верная
Остается ждать, когда Вы замкнете на DJVU, отдохнете и, если будет вдохновение,  пойдете по второму кругу.
 

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 16:28 18-02-2010 | Исправлено: Dashout, 16:29 18-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
Вы говорите приблизительно об этом

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 17:29 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
об этом

Вы знаете, нет, не совсем
это ручной режим, подобный реализован в PDF-Viewer (Обрезка страниц). На 500 страниц - "устанет рука"!
У СТ есть шик - это автоматизация, причем, интеллектуальная.
Убежден, что этот шик нужно сохранить.
Насколько я понимаю - это возможно. Но, меняется логика обработки страниц и дальнейшего использования результатов.

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 18:14 18-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
гораздо универсальнее была бы такая фича:
центрированная по полезной области
рамка контекста
фиксированного размера.
 
Правильно понимаю что для Вашего случая данной  фичи было бы достаточно ?

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 20:51 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
нет, я имею виду не конкретную операцию, а подход, логику обработки изображения относительно конечной продукции.
Что объявляем конечной продукцией? Тут у каждого свои представления: это и автоматизированный процесс обработки, и корректировка, и т. д. Все, каждый будет прав! - но это все процессы. Где продукция?
По-любому, на данном этапе разработки, конечной продукцией являются обработанные в СТ изображения страниц книги, которые далее переводятся в е-книгу. т.е., читабельная страница (не текст, а именно страница с текстом! в книге все страницы равны).
Если так, то есть противоречие: существует вероятность получения на этапе вывод изображений размером 9,5*13,6 см! (не говорю про DPI, это технический показатель).
Выигрывая на скорости я сжимаю изображение, но далее-то мне его нужно восстановить!? СТ, сжимая на 600 DPI, как-бы оставляет резерв на восстановление...
Что дальше, начиная после СТ увеличивать размер (растягивая картинку) я неизбежно ухудшаю полученное в СТ качество.
Учитываем, что в страницах "плавает" фокус (масштаб) - еще хуже!
 
Поэтому, мое предложение было ввести маску читабельной страницы сразу в процесс обработки первичного изображения. Предлагал название этой маски - информационная площадь страницы (ИП).
В этом случае, DPI, как и обрабатываемое изображение страницы, становятся переменной величиной.
На выходе задача ставится так: на какой коэффициент увеличить изображение, чтобы ИП (страницы) была равна ИП (маски).
В настоящее время, логика модели (и далее, алгоритмы) не учитывает качество конечной продукции читабельной страницы, поэтому, надо ждать второго круга.

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 21:52 18-02-2010 | Исправлено: Dashout, 22:34 18-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я тут вот о чем подумал.  Есть фичи, которые могут в принципе быть полезными, да и реализуются не слишком сложно, но которые я все равно не хочу добавлять.  Мое мнение состоит в том, что любая новая галочка в интерфейсе - это удар по простоте использования.  Соответственно нужна весьма веская причина для ее добавления.  Для энтузиастов же, чем больше фичей, тем лучше - в конце концов они знают, для чего каждая из них нужна.  Так вот - а нет ли желающих сделать мод или даже форк ST как раз с целью добавления всевозможных фичей?  По типу как существуют всякие там eMule Plus и Dreamule - форки eMule.  Меня бы такая ситуация вполне устроила.  И энтузиасты получили бы, что хотели, и на меня давление ослабло бы.  А так я и творец-создатель, и тех-саппортер, и учитель младших классов (очевидности часто объяснять приходится), и диктатор, которому наплевать на нужды народа.  Вполне готов поделиться некоторыми из этих титулов  Желающие есть?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:16 19-02-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
мод или даже форк ST

А может быть, Вы сделаете ST способным принимать плагины? Это было бы идеально.
===
Не фичи:
1) Деспекл. По роду деятельности я аккумулирую различные биологические книги, и в последнее время все больше и больше книг приходит без точек в оглавлениях, формулах и разных других местах. Это значит, что начинающие сканировщики все чаще и чаще пользуются ST, но никто из них не знает об особенностях деспекла. Я пытаюсь с этим бороться, но во многих случаях с автором файла связаться нельзя или уже поздно -- оригинальные сканы стерты. Нельзя ли, пока Вы не наладили деспекл, либо (а) сделать галочку "удалять пятна" по умолчанию не нажатой либо (б) где-то на видном месте поместить предупреждение? Первое лучше, потому что предупреждений, как правило, никто не читает.
2) Разрешение. Несколько раз уже возникали проблемы с файлами, в которых разрешение записано неправильно (и к тому же разное в разных файлах), а ввести его насильно не удается, кнопка "Применить" не активна. Я пытался удаленно помочь человеку, дело кончилось тем, что он просто взял СК. По-моему, надо сделать возможным насильственное введение разрешения во всех случаях. Уж если пользователь нажал галочку "Править разрешение", то он, скорее всего, знает, что делает.
Еще одна неприятность в таком случае -- это на стадии макета обнаружить, что некоторые страницы в разы больше остальных. Начинающего пользователя это просто вводит в ступор.
3) Наклон. ST регулярно "врет" на страницах с таблицами рисунков. Если рисунков много, то редактирование превращается в тихий ужас. К тому же логика программы страдает -- ведь на всех этапах, кроме этого (и полезной области), можно массово применить параметр ко всем или части страниц. Поэтому я думаю, что массовое применение наклона не новая фича, а необходимое дополнение к логике программы.
4) Бинаризация. Существующего движка не хватает для оптимального "зачернения". Особенно это сказывается в режиме "Смешанный", если есть одна-две больших фотографии (не нашел закономерности, но это как-то связано с положением фотографий в текстовом блоке). В этом случае текст, нормально бинаризующийся на остальных страницах, просто пропадает, то есть перестают быть видимыми отдельные слова. Отключение деспекла и доведение движка до 15 решает проблему только в половине случаев. Дело недавно дошло до того, что 12 страниц мне просто пришлось выводить в цветном режиме и руками бинаризовать текстовые области в фотошопе. Я не думаю, что это правильно. Можно ли хотя бы увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 03:25 19-02-2010 | Исправлено: iit512, 03:37 19-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Желающие есть?

Конечно есть. Но моды станут известными только в узком кругу пользователей, которые хотят до конца разобраться со всеми возможностями программы.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 07:03 19-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Разъясните, пожалуйста, Ваш пост http://forum.ru-board.com/topic.cgi?forum=5&topic=27424&start=2100#4 - а то абсолютно ничего не понятно.
 
Tulon

Цитата:
Устал я от потока негатива, который идет с этого форума.

Этот негатив порождаете Вы сами. Так что не надо пытаться обвинять кого-то ещё, когда на самом деле причина - в Вас. Не хотите получать негатив - делайте программу для людей, а не для себя. Это единственный выход, как Вам избавиться от негатива. А то я ведь могу и со страниц своего сайта подвергнуть СТ критике. "Против правды не попрёшь", знаете ли.

Цитата:
Решение, к которому я стемлюсь, это отдельная программа, которая будет принимать вывод ST, проделывать с ним всякие операции - подавление шума в картинках, увеличение контраста, коррекция уровней, и кодировать все это в DjVu.

Так что же Вы раньше молчали? Это полностью меняет дело - при условии, конечно, что такая программа будет производить вывод по принципу СТА.

Цитата:
Цитата:А остальные DjVu-кодировщики? DEE 5.1, Document Express Editor 5 и 6 - их что, выбрасывать?
Метод раздельных сканов с ними все равно не используется.

Да - но только по вине bolega, не захотевшего сделать вывод субсканов в раздельные папки. В принципе, это возможно.

Цитата:
Либо я сделаю так, что они не будут замечать второго слоя в TIFFах

Думаю, никак Вы это не сделаете.
 
Альтернативы СТА нет.
 
Добавлено:
Tulon

Цитата:
Так вот - а нет ли желающих сделать мод или даже форк ST как раз с целью добавления всевозможных фичей?  

Это тоже хороший выход. Я как раз недавно предлагал то же самое.
 
Добавлено:
Я решил тоже связаться с Рамизом Зейналовым, автором варианта алгоритма Dewarping. Вот что он мне ответил:

Цитата:
Моя система справляется и с геометрическимими искажениями, и с неравномерным светом. Есть некоторые проблемы, связанные с user-friendly - много параметров, не совсем очевидных. По-хорошему, это надо дорабатывать.
Скоро моя система будет встроена в СканКромсатор.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:19 19-02-2010 | Исправлено: monday2000, 11:20 19-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А может быть, Вы сделаете ST способным принимать плагины? Это было бы идеально.  

Это потребует уйму усилий с моей стороны.  Плюс проблемы кросс-платформенности и бинарной совместимости.  Плюс ограниченность интерфейса плагинов.  Заведомо проиграшный вариант в общем.
 

Цитата:
(а) сделать галочку "удалять пятна" по умолчанию не нажатой либо (б) где-то на видном месте поместить предупреждение? Первое лучше, потому что предупреждений, как правило, никто не читает.  

В следующем релизе либо доведу до ума деспекл, либо отключу его по умолчанию.
 

Цитата:
надо сделать возможным насильственное введение разрешения во всех случаях

Ввод разрешения, сильно ниже реального, приводит к падениям из-за нехватки памяти.  Если же там реальное разрешение ниже 150, то использование СК для таких файлов - наилучший для меня вариант.
 

Цитата:
массовое применение наклона не новая фича, а необходимое дополнение к логике программы.  

Имеет смысл только массовый сброс в ноль - для уже выровнянных сканов.  Любой другой угол не имеет смысла применять массово, потому как от страницы к странице он гуляет.  Массовый сброс в ноль планируется, но не доходят до него руки.
 

Цитата:
Можно ли хотя бы увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Увеличу, когда руки до этого дойдут.  Скорее всего проблема там в чем-то другом, например плохо работет выравнивание освещения на данном скане.  Посмотрел бы, но уж больно устал заниматься тех-саппортом, так что лучше не надо.
 
woodyfon

Цитата:
Конечно есть. Но моды станут известными только в узком кругу пользователей, которые хотят до конца разобраться со всеми возможностями программы.

Остальные меня и не грузят.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:12 19-02-2010
ntsx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 

Цитата:
Есть фичи, которые могут в принципе быть полезными, да и реализуются не слишком сложно, но которые я все равно не хочу добавлять.  Мое мнение состоит в том, что любая новая галочка в интерфейсе - это удар по простоте использования.

 
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

Всего записей: 8 | Зарегистр. 12-02-2010 | Отправлено: 13:22 19-02-2010
ILHS

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ntsx

Цитата:
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

За.

Всего записей: 610 | Зарегистр. 06-12-2004 | Отправлено: 13:36 19-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

Пользователей оно бы конечно избавило от усложнения интерфейса, но кто избавит меня от усложнения кода?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:08 19-02-2010
ntsx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так синхронизация двух активных веток (в случае форка) будет еще затратнее.

Всего записей: 8 | Зарегистр. 12-02-2010 | Отправлено: 17:43 19-02-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru