[ubuntu-it] ricerca "case sensitive" su contenuto file .odt .doc. rtf
Lorenzo Sutton
lsutton a libero.it
Mar 18 Gen 2011 08:35:00 UTC
Ciao,
Non una vera soluzione ma qualche suggerimento...
paolo destefanis wrote:
> Cara lista,
> temo che la mia richiesta sia OT, pero` ci provo lo stesso e mi scuso,
> sperando di non seccare nessuno.
>
> Devo ricercare in qualche migliaio di file .odt, .doc e .rtf la parola
> "Pincopallo". Però tutti i file in questione contengono la parola
> "PINCOPALLO".
Per quanto riguarda i file odt, La cosa bella di odt è che in realtà è
un archivio zippato con vari file dentro (lo vedi perché Ubuntu dovrebbe
permetterti di aprirlo con l'archive manager (per intenderci quello con
cui apri anche i .gz, gli .zip ecc)). La 'ciccia' è nel file
content.xml... che potrebbe essere ricercato in varie maniere (da un
grep nudo e crudo (con l'opzione -i ignori il "case sensitive") o,
magari se lo conosci sed ecc., oppure uno script python che fa il parse
dell'XML.... dipende cosa devi fare. La cosa si potrebbe automatizzare
con uno script [1]
Per i doc ai fini della ricerca potresti convertirli in odt (c'è un modo
di farlo in batch).
Per gli rtf. Sono testo "semplice" quindi potresti provare anche qui con
un grep nodo e crudo iniziale (dipende dalla stringa che cerchi...)
>
> Come faccio? C'è qualche programmillo che permette di fare una ricerca
> sul contenuto che sia case sensitive?
Sicuramente ma non che io sappia. Magari qualcun altro in lista.
> c'e` qualche modo di farlo con "find"?
>
> Mi sono spiegato? Qualcuno ha qualche idea? Grazie 1000!
Buona fortuna,
Lorenzo.
[1] Non è proprio il massimo della leggibilità, e attenzione perché
questo *rimpiazza* la prima occorrenza trovata. Peròpuò essere
d'ispirazione":
http://www.commandlinefu.com/commands/view/5945/batch-edition-of-all-openoffice.org-writer-files-in-the-current-directory-body-text
Maggiori informazioni sulla lista
ubuntu-it