Von mehreren .pdf-Dateien Zeilen mit einem bestimmten Suchwort ausgeben
Matthias Böttcher
matthias.boettcher at gmail.com
Mon Sep 17 11:24:13 BST 2007
Am 17.09.07 schrieb Detlef Lechner <Detlef.Lechner at gmx.net>:
> Am Montag, den 17.09.2007, 09:39 +0200 schrieb Matthias Böttcher:
>
> > find directory -type f -exec grep -a 'suchstring' '{}' \;
> >
> > man grep:
> >
> > -a, --text
> > Process a binary file as if it were text; this is equivalent to the
> > --binary-files=text option
>
> find /home/detlef/Computerhardware/IA-32/ -type f -exec grep -a 'BIOS'
> '{}' \; 2>/dev/null
> erzeugt einen ziemlichen Salat: http://ubuntuusers.de/paste/15061/
> Ich kann den String 'BIOS' in der Ausgabe nicht finden.
> Was habe ich falsch gemacht?
Ich weiß es nicht, warum der Suchbegriff 'BIOS' nicht gefunden wird
und würde Dir das erwähnte 'pdfgrep' empfehlen. Die interessante Zeile
in diesem Script lautet:
pdftotext -layout "$1" - | egrep $grepopts "$pat"
Es wird also erst das pdf-File in Text umgewandelt und dann mit egrep gesucht.
Gruß!
Matthias Böttcher