Home > GNU/Linux, Prompt > Trabajar con PDFs desde el prompt

Trabajar con PDFs desde el prompt

Instalamos PDFTK (The PDF ToolKit):
# aptitude install pdftk

Extraer paginas de un pdf (opcion 1):
$ pdftk file.pdf burst

Extraer paginas de un pdf (opcion 2):
$ convert -density 150 archivo.pdf img_%04d.tiff

Convertir imagenes en un pdf:
$ convert *.tiff archivo.pdf

OCR:
$ for x in $(ls img_*tiff); do gocr $x >> kk.txt; done

Extraer imágenes de un pdf:
$ pdfimages -j file.pdf img

Extraer texto de un pdf:
$ pdftotext file.pdf

Unir pdfs:
$ pdftk *.pdf cat output nuevo.pdf

Unir parte de unos pdfs con otros:
$ pdftk A=file1.pdf B=file2.pdf cat A1-2 B2 A3-4 output nuevo.pdf

Modificar los datos de propiedades de un pdf (autor, fecha de modificación…):
$ pdftk fichero.pdf dump_data output propiedades.dat
$ vi propiedades.dat
$ pdftk fichero.pdf update_info propiedades.dat output fichero_mod.pdf

Convertir pdf en txt:
$ pdftotext -layout fich.pdf fich.txt

Trabajar con PDFs desde el prompt, edición de PDFs desde la línea de comandos

Categories: GNU/Linux, Prompt
  1. No comments yet.

Comments will be sent to the moderation queue.

Security Code:

Para los artículos:
Creative Commons License 2003-2009 Güimi (http://guimi.net)
Está permitido copiar, distribuir y/o modificar los documentos bajo los términos de la licencia "Reconocimiento-Compartir bajo la misma licencia 3.0 España" de Creative Commons.

Puede ver una copia de esta licencia completa.

Para el código de programación:
General Public License GPL 2 - Copyright (c) 1998-2009 Güimi (http://guimi.net)
Está permitido copiar, distribuir y/o modificar los desarrollos bajo los términos de la licencia "GNU General Public License, Versión 2" de Free Software Fundation.

Puede ver una copia de esta licencia completa.

Reconocimiento tautológico: Todas las marcas pertenecen a sus respectivos propietarios.