Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » возврат преобразованных книг к типографскому макету

Модерирует : ShIvADeSt

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

vadim654

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос возник не вчера. Есть только преобразованные файлы книг (в EPUB, FB2, AZW3), но они не устраивают по разным причинам (нет соответствия страниц оригиналу и т.д.). Есть ли программы (или может наши непревзойденные программисты их создадут) для возврата (не дальнейшего преобразования!) к типографскому макету книги (как я понимаю, это PDF)? В конце-концов, ведь эти форматы с чего-то преобразовали и должен быть первоисточник (может вернуть время файла на дату издания книги (всегда указывается в Амазоне), это предположение, конечно!).
Помогите с этим разобраться.

Всего записей: 49 | Зарегистр. 07-04-2020 | Отправлено: 12:55 24-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vadim654
«Первоисточник» и «электронная книга» — это совсем разные вещи, друг с другом формально никак не связанные. В «электронной книге» никак не сохраняется форматирование «первоисточника», поэтому восстановить из неё типографский макет будет практически невозможно. Грубо говоря PDF — это сканированный оригинальный документ, фотография, можно сказать, а EPUB и FB2 — это просто голый текст, который во многом «на лету» форматируется электронным устройством (ширина строк, переносы, размер страницы — ничего этого там нет, всё это каждый раз подстраивается под устройство и настройки конечного пользователя).
 
Поэтому, боюсь, ваша идея нереализуема, проще искать PDF для нужных вам книг.

Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 13:25 24-05-2022
vadim654

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fscpsd
ну а если, допустим,EPUB-формат сделали из PDF-оригинала (мне думается, что так бывает довольно часто)?

Всего записей: 49 | Зарегистр. 07-04-2020 | Отправлено: 14:00 24-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vadim654
1. Вы почему-то считаете что после такого преобразования в конечном EPUB должны остаться следы оригинального форматирования, а это неверно. Книгу преобразовали и она стала с формальной точки зрения совершенно другим документом, понимаете? Преставьте себе, что вы отсканировали фотографию какого-нибудь договора, затем через программу-распознаватель (ФайнРидер какой-нибудь) преобразовали в текст и сохранили в формате МС Офис — у вас в итоге останется только сам текст, голый чистый текст, без каких-либо формальных признаков исходной фотографии. В результате будет два совершенно разных документа — исходный макет (огромная жирная фотография) и конечный документ (маленький-маленький файл МС Офис).
 
2. Честно сказать, я не знаю, что такое EPUB, но думаю, что примерно то же самое, что и FB2, а FB2 — это просто текст, грубо говоря, обрамлённый самым общим базовым форматированием, причём по большей части смысловым, а не формальным, т.е. разделы, главы, абзацы — это есть, а больше ничего нету, ну совсем ничего, понимаете?, никаких следов оригинального PDF-документа там не будет, это просто совершенно излишне. Нужен оригинал — смотрите оригинал, нужна удобная универсальная электронная книга — берёте её. Это две разных сущности, понимаете.

Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 14:23 24-05-2022
vadim654

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fscpsd
к сожалению, понимаю...
 
 
Добавлено:
fscpsd
хотя в EPUB есть все и текст и сноски и фото и схемы, те все от изначального PDF, но расставленные по-своемому. Может с этим форматом выгорит? Хочется верить!
 
Добавлено:
fscpsd
очень часто раздачи книг идут в паре EPUB/PDF

Всего записей: 49 | Зарегистр. 07-04-2020 | Отправлено: 14:27 24-05-2022 | Исправлено: vadim654, 14:31 24-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vadim654
С другой стороны, вы, судя по всему, имеете в виду какую-то серьёзную литературу (раз уж вам важно изначальное форматирование и точная нумерация страниц), а литература такого рода, как правило, распространяется как раз в формате PDF — именно как раз потому, что всем её читающим это тоже довольно важно. Лично я вот недавно искал некоторые книги Канта и обнаружил, что их просто вообще не существует в форматах элекронных книг — либо совершенно нечитабельные кривульки (да и те не найти), либо полное собрание сочинений в виде гигансткого PDF. Поэтому мне лично вообще не очень понятна ваша проблема. Можно представить себе что сложно найти исходный типографский макет какой-нибудь художественно литературы или беллетристики — просто потому, что читателям литературы такого типа даже само выражение «типографский макет», как правило, неведомо. Но любая околонаучная литература практически всегда распространяеся именно как раз в формате PDF, поэтому как-то не вполне понятно ваше огорчение.
 
Добавлено:
vadim654

Цитата:
в EPUB есть все и текст и сноски и фото и схемы, те все от изначального PDF, но расставленные по-своемому
Вот я вам как раз об этом и толкую! Несмотря на то, что это, по сути своей, один и тот же документ, но форматирование там совершенно различное! Т.е. с точки зрения смысла (текст, сноски, фото, схемы) — все одно и тоже, а вот именно как раз с точки зрения форматирования (в частности, жёстко заданная система страниц, точно соответствующих исходному бумажному варианту) — между нет совсем совершенно ничего ни капельки общего!

Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 14:37 24-05-2022
vadim654

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо за профессиональный ответ!
Вы правы, да именно научные монографии. НО! К глубочайшему сожалению, очень многие (особенно новинки) хакеры публикуют на потребу публики ТОЛЬКО в EPUB. Понятно, что преобразовали они их с оригинальных PDF, но где же их искать-то этих конкретных хакеров и просить, чтобы прислали оригинал. Больше того, многих книг нет и в библиотеках (хотя я и живу в СПб), поэтому и возникла не вчера эта проблема. Вот и горожу огород!

Всего записей: 49 | Зарегистр. 07-04-2020 | Отправлено: 15:14 24-05-2022 | Исправлено: vadim654, 15:18 24-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Думается, вам как-то нужно пытаться искать источник всего этого дела, совершенно определённо он где-то есть. Подобно тому, как в разных местах Интернета кучкуются специалисты по взлому и публикации закрытого ПО, как-то примерно так же должно  быть и с интересующей вас литературой. Если для вас эта проблема представляет долгосрочный интерес, то нужно как-то стараться копать именно в этом направлении, иначе только и остаётся, что ждать у моря погоды. У нас в Андеграунде есть ведь раздел eBookz — быть может, для начала там поискать, поспрашивать, быть может, кто-нибудь и слышал что-нибудь, сможет указать дальнейшее направление.

Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 15:41 24-05-2022
vadim654

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fscpsd
Да я пытался обращаться. Даже в известном sanet.st писал раздающим сколько раз. Письма они не замечают...

Всего записей: 49 | Зарегистр. 07-04-2020 | Отправлено: 16:13 24-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vadim654
Очень жаль, от всей души вам соболезную. Жить в 21 веке и не иметь возможность читать, что хочется и как хочется, — это, безусловно, трагедия.

Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 16:23 24-05-2022
AlexDAT



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот вообще не факт, что книги преобразуют из PDF в EPUB.
Известная программа Abby FineReader. Можно отсканировать в неё документ и сразу сохранить хоть в EPUB, хоть в вордовский документ, хоть в FB2. Вполне возможно, что в разных форматах и появляется таким образом. Подробнее... Исключение, какие-нибудь специфические форматы, которым нужны свои конвертеры.


Как ранее уже объяснили, возвращать нечего. Здесь только можно преобразовывать, используя типичные особенности того или иного формата. Бесплатно получить создание такой программы практически нереально, т.к. это специфическая задача, требующая множества знаний и времени. В единичных случая быстрее использовать доступные редакторы, чтобы самостоятельно переформатировать книгу.


Изначально написано о возврате к типографскому макету. Хоть и есть общепринятые стандарты, но даже в рамках одной серии книг часто не удаётся сохранять единый вариант выпуска (надпись на корешке, цвет страницы, размеры и отступы). Так что именно в такой формулировке задача ещё сложнее, а ещё нужно учитывать особенности плоттера, раскроя бумаги и т.п.
Заканчиваете вы словами о чтении, что не соотносится с задачей печати книг. Так что изначально задача должна быть сформулирована правильно, иначе не получите даже приблизительно желаемый результат.
 
Добавлено:
P.S. Если исходить из варианта, что обсуждаемые книги сделаны в Abby FineReader, то изначальный формат после сканирования вообще является OCR-проектом в виде папки со множеством файлов специфичного формата, который даже книгой сложно назвать. Так что не нужно считать, что есть какой-то исходный особый формат. У издателей книг вообще другая задача и принцип создания бумажных книг, поэтому электронную книгу они могут сверстать из чистого текста, добавив картинки и другие специфичные формату параметры. Подробнее можете узнать только тогда, когда посетите типографию и вживую узнаете тонкости работы. Рассказ в Интернете даст только косвенные знания.

Всего записей: 2940 | Зарегистр. 21-04-2009 | Отправлено: 03:35 25-05-2022
Roman_Hayretdinov



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да я пытался обращаться. Даже в известном sanet.st писал раздающим сколько раз

А вы точно везде искали? Есть ведь много других сайтов с научной литературой, например Sci-Hub и LibGen

Всего записей: 68 | Зарегистр. 19-12-2021 | Отправлено: 12:17 29-05-2022 | Исправлено: Roman_Hayretdinov, 12:20 29-05-2022
fscpsd



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vadim654
Искал плагин для экспорта в epub, и нашёл очень хорошее объяснение, почему никак невозможно восстановить из ePub и Fb2 какую бы то ни было исходную вёрстку.
Цитата:
«Преимуществом этих форматов является то, что они не привязываются к оформлению и не зависят от таких категорий, как формат бумаги(это понятие вообще отсутствует), размер шрифта и т.д. Данные форматы электронных книг задают лишь общую структуру документа, а все остальное задается непосредственно самим пользователем или стандартными настройками его программы-просмотрщика (читалки). Данное свойство по-научному называется плавающей вёрсткой и делает эти форматы удобными для просмотра на устройствах с разным разрешением экрана.»
http://librerussia.blogspot.com/2014/12/libreoffice-epub-fb2.html


Всего записей: 1854 | Зарегистр. 16-09-2010 | Отправлено: 04:09 01-06-2022 | Исправлено: fscpsd, 04:10 01-06-2022
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
fscpsd

Цитата:
Искал плагин для экспорта в epub

там и искать нечего.. epub, к примеру, контейнер с html страницами, css, картинками и файлами шрифтов.
содержимое которого удобно форматируется в зависимости от размера шрифта и отображаемой области. тот же pdf так не умеет, он создан для одинакового отображения. поэтому, при переносе, все это теряется..

Всего записей: 15121 | Зарегистр. 20-09-2014 | Отправлено: 05:13 01-06-2022 | Исправлено: Mavrikii, 05:13 01-06-2022
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » возврат преобразованных книг к типографскому макету


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru