Trabajar con PDFs desde el prompt
Instalamos PDFTK (The PDF ToolKit):
# aptitude install pdftk
Extraer paginas de un pdf (opcion 1):
$ pdftk file.pdf burst
Extraer paginas de un pdf (opcion 2):
$ convert -density 150 archivo.pdf img_%04d.tiff
Convertir imagenes en un pdf:
$ convert *.tiff archivo.pdf
OCR:
$ for x in $(ls img_*tiff); do gocr $x >> kk.txt; done
Extraer imágenes de un pdf:
$ pdfimages -j file.pdf img
Extraer texto de un pdf:
$ pdftotext file.pdf
Unir pdfs:
$ pdftk *.pdf cat output nuevo.pdf
Unir parte de unos pdfs con otros:
$ pdftk A=file1.pdf B=file2.pdf cat A1-2 B2 A3-4 output nuevo.pdf
Modificar los datos de propiedades de un pdf (autor, fecha de modificación…):
$ pdftk fichero.pdf dump_data output propiedades.dat
$ vi propiedades.dat
$ pdftk fichero.pdf update_info propiedades.dat output fichero_mod.pdf
Convertir pdf en txt:
$ pdftotext -layout fich.pdf fich.txt
Trabajar con PDFs desde el prompt, edición de PDFs desde la línea de comandos

