Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Открыть новую тему     Написать ответ в эту тему

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay)
О технологии MRC с примерами - 1, 2
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1, 2
Редактировать текст - PDF-XChange Editor, Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: useretail, 17:00 11-02-2024
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher, можете выложить файлы на другой обменник, например на workupload.com или pixeldrain.com?

Всего записей: 7341 | Зарегистр. 08-09-2001 | Отправлено: 09:47 10-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
https://workupload.com/archive/Q8fZXtuZdW

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 10:28 10-09-2023
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD Неплохо у вас получилось! Буквы стали немного «скакать», но это мелочи, на которые можно не обращать внимания. Главное размер почти в 10 раз уменьшился. А испорченную 13 страницу я просто заменил. Попробую разобраться с этим Clean Image в Акробате

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 12:37 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
 
Неплохо у вас получилось!
 

Image 2496x3645 -> 1204x1758. Не слишком ли "крутой" downsample для текста? ИМХО: очень слишком.
 
Пайтоновский скрипт pdf-scripts: optimize_pdfs.py на базе pikepdf и jpgcrush на вашем файле дал чисто lossless 317281875 -> 257379857. Ежели  jpgcrush в скрипте подменить на jpegoptim, так можно ещё на lossy будет наварить без всяких downsample.
 
PS: А на самом деле ваша PDF-ка просто набор JPEG-ов, которые удобнее хранить и просматривать в CBZ(ZIP). Там и "мета" варганится в виде простого произвольного текстового файла.
 
 
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 13:30 10-09-2023 | Исправлено: zvezdochiot, 13:31 10-09-2023
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Пайтоновский скрипт pdf-scripts: optimize_pdfs.py на базе pikepdf и jpgcrush на вашем файле дал чисто lossless 317281875 -> 257379857. Ежели  jpgcrush в скрипте подменить на jpegoptim, так можно ещё на lossy будет наварить без всяких downsample

А можно как-нибудь попроще, для гуманитариев? Я Orpalis и XChange кое-как освоил) А тут какой-то скрипт, который без подробного пошагового (желательно на видео) мануала непонятно как использовать. Да и результат вы не показали. Видимо он лучше, чем у LonerD

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 14:00 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
 
А можно как-нибудь попроще, для гуманитариев?
 

zvezdochiot say:

Цитата:
 
А на самом деле ваша PDF-ка просто набор JPEG-ов, которые удобнее хранить и просматривать в CBZ(ZIP). Там и "мета" варганится в виде простого произвольного текстового файла.  
 

Не знаете, что такое ZIP?
Для изъятия JPEG-ов пользуйте "PDF Image Extractor Free". Для оптимизации изъятых изображений пользуйте "Voralent Antelope". Для упаковки в CBZ (ZIP) - любой удобный вам архиватор.
 
 
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 14:35 10-09-2023 | Исправлено: zvezdochiot, 14:45 10-09-2023
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не знаете, что такое ZIP?

Знаю конечно.

Цитата:
Для изъятия JPEG-ов пользуйте "PDF Image Extractor Free"

Полагаю это прекрасно можно и через XChange сделать.

Цитата:
Для оптимизации изъятых изображений пользуйте "Voralent Antelope"

С этим софтом незнаком, но посмотрю.

Цитата:
Для упаковки в CBZ (ZIP) - любой удобный вам архиватор

Вообще-то мне желательно pdf оставить. Только в оптимизированном (размер уменьшить, а то 320 мб многовато) виде.
 
Можете показать результат оптимизации тем скриптом (прямо файлом желательно)? Чтобы и размер pdf был заметно уменьшен и качество не сильно упало.

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 14:55 10-09-2023 | Исправлено: amosopher, 14:55 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
 
Вообще-то мне желательно pdf оставить.  
 

Зачем? Ежели это один чорт JPEG-и? Во что бы ты их не упаковал, это всё равно те же самые JPEG-и.
 
amosopher say:

Цитата:
 
Можете показать результат
 

Я же по-русски написал, что он 250Мб lossless.То есть визуальных отличий нет совсем при любом зуме. А сношаться с файлопойками нет никакого желания. Да и что вам дадут 70Мб? Эти JPEG-и нормально обработать надо и сделать из них нормальную книгу, а не исхищряться с downsample-нгом, разрезкой на лоскуты, lossy и прочей фигнёй.
 
PS: Единственный вариант в "вашем" видении: перекодировать JPEG-и в JPX-ы (JPEG2000). Но кнопочный софт для таких дел мне неизвестен.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 15:04 10-09-2023 | Исправлено: zvezdochiot, 15:09 10-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 

Цитата:
amosopher
Чтобы и размер pdf был заметно уменьшен и качество не сильно упало

ну опять начинаются влажные фантазии.
Сие невозможно.

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 15:09 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
 
Вообще-то мне желательно pdf оставить.
 

Выложите ссылку на ваши "pdf"-ки в OCR форум › Сырые сканы книг (для обработчиков) как сырьё. Может кто то и обработает. Но на выходе скорее всего будет DjVu. Но при этом не будет дичи с dowsampling-ом текста.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 15:17 10-09-2023
amosopher

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Выложите ссылку на ваши "pdf"-ки в OCR форум › Сырые сканы книг (для обработчиков) как сырьё. Может кто то и обработает. Но на выходе скорее всего будет DjVu. Но при этом не будет дичи с dowsampling-ом текста

Спасибо, попробую. А в djvu тоже неплохо. Его легко можно конвертировать в pdf через DjvuToy
 
Добавлено:

Цитата:
ну опять начинаются влажные фантазии.
Сие невозможно

Иногда можно раздутые и неправильно собранные pdf разобрать на картинки, обработать их и снова собрать. Получается pdf раз в 10 меньшего размера с таким же качеством. Но сильно уменьшить размер корректного pdf конечно невозможно. Или с потерями или никак

Всего записей: 137 | Зарегистр. 29-01-2010 | Отправлено: 15:21 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amosopher say:

Цитата:
 
Иногда можно...
 

А ещё есть гуманитарный вариант для гуманитариев: Сдружиться с сотрудниками указанных в изданиях типографий и под шафе выносить из них исходные векторные pdf-ки, а не связываться со сканами, которые вам "непонятны".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 16:51 10-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но сильно уменьшить размер корректного pdf конечно невозможно

ну вот с хрена ли невозможно. постеризовал одну страничку, получил из 1,2 мегабайта 300кил.

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 17:37 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
постеризовал одну страничку, получил из 1,2 мегабайта 300кил.
 

А ты чем делаешь? Мне чисто для сравнения методики и удобств. А то "слегка" чувство, что собираюсь "изобретать велосипед". Ежели где реально удобно, хотелось бы "позаимствовать опыт".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 17:53 10-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А ты чем делаешь?

сканкромсатором

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 18:22 10-09-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, спасибо за ссылки.
 

Цитата:
ну вот с хрена ли невозможно. постеризовал одну страничку, получил из 1,2 мегабайта 300кил.

В djvu выйдет меньше.

Всего записей: 7341 | Зарегистр. 08-09-2001 | Отправлено: 20:24 10-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los say:

Цитата:
 
В djvu выйдет меньше.
 

Меньше то меньше. Но вот только всё говорит в пользу малоцветки (это чтоб ещё и отображение было на высоте). Но что то мне подсказывает, что будет применён FG44, а не FGbz. А даже ежели будет применён FGbz, то сделан он будет достаточно лажёво. Щаз сам "экспериментирую" с полуавтоматическими методами и вижу, что ежели не задавать вручную цветовые области, то цвета получаются "в крапинку", то бишь серый цвет всю малину портит, а серых надписей как грязи. Вот вам и вопрос: Как же и чем же сделать цветные надписи, ежели серые всё портят? Очевидно, что фотошоп, но это же геморрой страшенный. А в SK есть механизм получения чистых цветных надписей? Вроде как есть, но хотелось бы услышать подтверждение и насколько это муторно.
 
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 21:56 10-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
насколько это муторно

я ролик писал
 
UPD
https://youtu.be/FnoqZe-uEhU

Всего записей: 3067 | Зарегистр. 15-07-2010 | Отправлено: 05:17 11-09-2023 | Исправлено: TelecomUral, 12:01 11-09-2023
73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Для оптимизации изъятых изображений пользуйте "Voralent Antelope"
Я-то думал, эта Антилопа нечто новое и крутое, а оно тупое и тормозное. На jpg вчистую проиграла даже старой версии Riot 1.0.1 x32, сейчас новая версия 2023.7 x64. Оптимизировался один и тот же jpg файл 7 375 896, 4368 x 2912 пикселей, цветная групповая фотография, в Антилопе даже не предусмотрено превью и степень оптимизации, никаких цифр нет, кроме сэкономленных метров, получилось всего 2 с хвостом и то после ожидания. Короче, клиенту предлагается только верить что софт работает и его вообще стоило запускать. Riot влегкую сделал файл в десять раз меньше - 719 687 и практически неотличимый на глаз от оригинала. Как говорят, почувствуйте разницу - https://riot-optimizer.com/download/

Всего записей: 1151 | Зарегистр. 18-08-2012 | Отправлено: 10:43 11-09-2023 | Исправлено: 73, 10:45 11-09-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
73 say:

Цитата:
 
Я-то думал, эта Антилопа нечто новое и крутое
 

Зачем крутое? Я говорил за lossless. Никакие lossy особо не интересуют, потому как "практически неотличимый" уже практически не поддаётся нормальной обработке. А сканы обрабатывать надобно, а не пихать в сыром виде непойми куда. Такие вот дела.
 
PS: Сложно оценить вашу "победу" с помощью lossy, так как ваш "результат" всё-равно проигрывает JPX (JPEG-2000).
 
TelecomUral say:

Цитата:
 
UPD
 

От души спасибо. Смотрю.
 
PS: Изначальный результат мало отличается от k-means (окантовка только у вас +/-). А вот сохранение палитры и ручная морфология - вещь. Но муторно. Но вещь. Только "слегка" непонятно отсутствие обычной морфологии. С помощью erode, dilate, open и close всё бы по шустрее происходило (ежели ограничивать морфологию маской от порога). И результат был бы более предсказуемым и менее человекозависимым.
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 11:54 11-09-2023 | Исправлено: zvezdochiot, 13:15 11-09-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru