Ich hatte das Problem dass ich Seiten aus PDF extrahieren wollte. Nun kann der Acrobat Reader zwar Seiten selektiv drucken, aber eben nur das ganze Dokument speichern.
Eine erste Idee wäre gewesen einfach die interessanten Seiten auf einen „PDF-Drucker“ zu drucken. Da hatte ich aber Bedenken dass die Abbildungen an Qualität verlieren.
Ich brauche also eine Software die das besser kann. Zusätzlich sollte die Software nichts kosten, am besten noch ein Open Source Projekt sein.
Eine Suche im Netz brachte das „pdftk the pdf toolkit“ zum Vorschein.
Dabei handelt es sich um ein Kommandozeilenwerkzeug um PDF Dateien zu manipulieren. Die Funktionen die ich bislang verwendet habe sind das Rotieren von Seiten und das Schneiden und neu Zusammenfügen von PDF Dateien. Das funktioniert wie gewünscht.
Mit dieser Zeile wird zum Beispiel ein neues PDF out.pdf erzeugt das die Seiten 12 bis 17 der Datei input.pdf enthält:
1 |
pdftk.exe input.pdf cat 22-17 output out.pdf |
Mehr Infos über das Programm und weitere Anwendungsbeispiele finden sich auf der Projektseite. Den Quellcode des GPL Tools gibt es dort auch zum Download. Für Windows, MacOS und Linux gibt es schon fertige Binaries, alle anderen müssen selbst compilieren.