Сайт для работы с pdf
Jan. 27th, 2015 12:21 pmПериодически коллеги-блогеры спрашивают, как сделать что-то полезное с файлами в формате pdf. Странички повыдёргивать, например, или сохранить как картинки и т.п.
Ежели у кого нет спецЫальных программ, могу порекомендовать свеженайденный онлайн-сервис по работе с пдф. Он позволяет сделать больше, чем известные мне ранее (правда, для меня это не актуальный вопрос, поэтому я такими сервисами не очень активно пользуюсь, а значит, далеко не все знаю), и при этом довольно удобный.
В общем: Валабуев, вот вам ссыль - http://smallpdf.com/ru.
Ежели у кого нет спецЫальных программ, могу порекомендовать свеженайденный онлайн-сервис по работе с пдф. Он позволяет сделать больше, чем известные мне ранее (правда, для меня это не актуальный вопрос, поэтому я такими сервисами не очень активно пользуюсь, а значит, далеко не все знаю), и при этом довольно удобный.
В общем: Валабуев, вот вам ссыль - http://smallpdf.com/ru.

no subject
Date: 2015-01-27 09:47 am (UTC)Обширная коллекция книг, журналов и прочей печатной продукции, собранная из различных источников, не всегда имеет внятные имена файлов. Хотелось бы программку, которую можно напустить на каталог с этими богатствами и которая бы аккуратно выдернула первую страничку-обложку и сохранила в том же каталоге с тем же именем, только в формате jpg. Как ни странно, ничего подобного не находится. Можно выдирать в ручном режиме, можно разбирать файлы постранично, но вот такой штуки, что описал, никак не найду.
no subject
Date: 2015-01-27 02:00 pm (UTC)no subject
Date: 2015-01-27 02:33 pm (UTC)no subject
Date: 2015-01-27 02:36 pm (UTC)no subject
Date: 2015-01-27 02:52 pm (UTC)Решение с обложками, кмк, вполне хороший выход из положения, я, когда начал искать, был уверен, что такие утилитки должны быть, но, к своему удивлению, ничего даже похожего не нашел.
no subject
Date: 2015-01-27 02:54 pm (UTC)no subject
Date: 2015-01-27 03:14 pm (UTC)В итоге связка искалок -- встроенная в Total Commander и Everything. Ну и самый лучший каталог -- организованная файловая структура.
no subject
Date: 2015-01-27 03:15 pm (UTC)Эх, завидую...
no subject
Date: 2015-01-27 03:18 pm (UTC)no subject
Date: 2015-01-28 12:22 am (UTC)пишем скрипт, который делает это со всей директорией.
наверняка и без pdftk можно обойтись, если вчитаться в хелп imagemagick; просто я не интересовался.
еще можно тупо ghostscript взять, кстати.
no subject
Date: 2015-01-28 12:17 pm (UTC)А не подскажете, где про скрипты почитать, что-то вроде "быстрого старта"? А то гугль по запросу каких только скриптов не выдает :)
Как я понимаю, это нечто вроде bat-файлов, только под винду? Соответственно, берем несколько консольных утилит, прописываем в скрипт их вызов с определенными параметрами, напускаем скрипт на место хранения книжек, после чего он пережевывает все файлы и выдает требуемый результат?
no subject
Date: 2015-01-28 09:51 pm (UTC)пример:
rem for %%f in (%1\*.tif) do ( convert "%%f" -trim +repage -compress group4 -strip "%2\%%~nf.tif" )
при установленном imagemagick такой батник, будучи запущен с двумя аргументами из командной строки, берет все тифы в директории "первый аргумент", обрезает края, бинаризирует и сохраняет в директории "второй аргумент". convert это команда imagemagick.
хттп : / / en. wikibooks. org / wiki/Windows_Batch_Scripting#Syntax
не знаю, впрочем, хороший ли это мануал; не читал.
еще в винде есть power shell, вроде бы поприятнее.
под linux же можно для своего скрипта любой установленный скриптовый язык, указав путь к нему в первой строке после hashbang. по умолчанию это bash.
no subject
Date: 2015-01-29 12:23 pm (UTC)Я, похоже, нашел специальную утилитку, называется mudraw, входит в пакет mutools.
Команда
mudraw -o имяфайла-%d.jpg -w600 -h800 имяфайла.pdf 1-10
выводит первые 10 страниц имяфайла.pdf в картинки размером 600х800 с именами имяфайла-1.jpg.
Теперь разберусь с батником, и, похоже, задача будет решена.
Еще раз спасибо!
no subject
Date: 2015-01-29 03:00 pm (UTC)Сделал батник из одной строки
for /R %%I in (*.pdf) do mudraw -o "%%I.png" -w600 -h800 "%%I" 1
В каталог с книжками закидываю этот батник и файлик mudraw.exe. Запускаю батник. На выходе файлы форматом 600х800 (точнее, по максимальному из этих размеров) в формате png. С jpg почему-то не получилось, по одному удается конвертировать, пакетом -- нет. Ну и ладно.
Теперь еще что-то с djvu придумать осталось :)
Но уже и так очень хорошо.
no subject
Date: 2015-01-29 07:27 pm (UTC)djvudecode?
ну и imagemagick все же стоит поковырять из общих соображений; это такой крокодил, который почти все умеет.
еще есть режим batch-обработки в xnview, в котором можно все выбрать в gui и автоматически сохранить в скрипт.
no subject
Date: 2015-01-30 06:07 am (UTC)Попробую, по аналогии должно все получится.
Нашел еще программку DjvuOCR -- по сути, это GUI к тому же djvudecode. Также можно выбрать несколько файлов, диапазон страниц, разрешение, формат, после чего в пакетном режиме все обрабатывается. Ограничений два:
1). Нельзя задать каталог, тем более, с подкаталогами -- только отдельные файлики.
2). Жестко задаются размеры выходного файла, то есть не сохраняются пропорции. Можно задать разрешение, но тогда картинки будут разного размера.
В принципе, и так можно работать, но все же я разберусь в параметрах djvudecode -- там, похое, все нужное есть.
no subject
Date: 2015-02-03 09:18 am (UTC)Делаем батник из двух строчек:
for /R %%I in (*.pdf) do mudraw -o "%%I.png" -w600 -h800 "%%I" 1
for /R %%I in (*.djvu) do djvudecode\djvudecode --output-format=jpeg --page-range="1" --dpi=72 "%%I" "%%I.jpg"
Закидываем в каталог с книгами файл mudraw.exe, каталог djvudecode со всеми файлами и этот батник. Запускаем. В итоге получаем картинки первой страницы для всех pdf и djvu во всех каталогах.
Из-за ограничений исходных утилит:
1. Превью для pdf получается в формате png, для djvu -- в jpg.
2. Превью для djvu получаются разного размера -- там можно либо жестко задать размер без сохранения пропорций, либо ограничится разрешением в зависимости от разрешения исходного файла.
3. Для некоторых pdf с кириллическими именами в кириллических каталогах с векторной графикой (не растровых сканов) пропадают шрифты.
1 и 2, в принципе, легко лечатся пакетной конвертацией с помощью утилиты convert из пакета imagemagick? но мне уже лень :)
Еще раз спасибо за подсказки!
Сайт для работы с pdf
Date: 2015-01-27 10:12 am (UTC)Сайт для работы с pdf
Date: 2015-01-27 11:22 am (UTC)