[ubuntu-it] ricerca "case sensitive" su contenuto file .odt .doc. rtf

Lorenzo Sutton lsutton a libero.it
Mar 18 Gen 2011 08:35:00 UTC


Ciao,

Non una vera soluzione ma qualche suggerimento...

paolo destefanis wrote:
> Cara lista,
> temo che la mia richiesta sia OT, pero` ci provo lo stesso e mi scuso, 
> sperando di non seccare nessuno.
>
> Devo ricercare in qualche migliaio di file .odt, .doc e .rtf la parola 
> "Pincopallo". Però tutti i file in questione contengono la parola 
> "PINCOPALLO".
Per quanto riguarda i file odt, La cosa bella di odt è che in realtà è 
un archivio zippato con vari file dentro (lo vedi perché Ubuntu dovrebbe 
permetterti di aprirlo con l'archive manager (per intenderci quello con 
cui apri anche i .gz, gli .zip ecc)). La 'ciccia' è nel file 
content.xml... che potrebbe essere ricercato in varie maniere (da un 
grep nudo e crudo (con l'opzione -i ignori il "case sensitive") o, 
magari se lo conosci sed ecc., oppure uno script python che fa il parse 
dell'XML.... dipende cosa devi fare. La cosa si potrebbe automatizzare 
con uno script [1]

Per i doc ai fini della ricerca potresti convertirli in odt (c'è un modo 
di farlo in batch).

Per gli rtf. Sono testo "semplice" quindi potresti provare anche qui con 
un grep nodo e crudo  iniziale (dipende dalla stringa che cerchi...)
>
> Come faccio? C'è qualche programmillo che permette di fare una ricerca 
> sul contenuto che sia case sensitive? 
Sicuramente ma non che io sappia. Magari qualcun altro in lista.
> c'e` qualche modo di farlo con "find"?
>
> Mi sono spiegato? Qualcuno ha qualche idea? Grazie 1000!
Buona fortuna,
Lorenzo.

[1] Non è proprio il massimo della leggibilità, e attenzione perché 
questo *rimpiazza* la prima occorrenza trovata. Peròpuò essere 
d'ispirazione": 
http://www.commandlinefu.com/commands/view/5945/batch-edition-of-all-openoffice.org-writer-files-in-the-current-directory-body-text



Maggiori informazioni sulla lista ubuntu-it