Beagle: Funktionsumfang
email.listen at googlemail.com
email.listen at googlemail.com
Son Mar 18 09:59:39 GMT 2007
On Sat, 17. March 2007 20:58:31 Detlef Lechner wrote:
> Hallo UbuntuUsers,
>
> habe ich das in Synaptic richtig gelesen: Beagle kann man bisher nur im
> Firefox als Extension benutzen? Durchsuchen der manPages ist nicht
> möglich?
Nur Firefox, nein
Durchsuchen der manpages nicht möglich, auch nein. Man muss ihm nur sagen er
soll sie zuvor indizierern. Beagle indiziert alles was man ihm befiehlt zu
indizieren.
Übrigens Manpages werden bereits vom System indiziert. Mit 'apropos BEGRIFF'
hast du zugriff auf alle manpages.
Allerdings hat es sehr guten Grund das kein Mensch mehr von diesem in Mono
programmierten Monster Beagle spricht sondern dagegen beinahe alle Welt
Tracker stattdessen empfiehlt. Vor allem auf Systemen die nicht bereits mit
einem P-VII 12000 der neuesten CPU-Generation und 1,5PByte RAM bestückt sind
für die Beagle als Mindestanforderung ausgelegt ist.
In der ~/.Tracker/tracker.cfg kann man festlegen das auch die manpages
durchsucht werden sollen:
[Watches]
WatchDirectoryRoots=/home/DeinUserName;
WatchDirectoryRoots=/usr/share/man;
Ich halte es allerdings für nahezu sinnfrei Werkzeugen wie tracker die
regelmässig aufs neue indizieren die Manpages vorzuwerfen. Manpages sind
nahezu statisch, sie ändern sich im Vergleich zum Homeverzeichnis eines Users
so gut wie garnicht. Für solche Verzeichnisse mit quasi statischem inhalt
sind Werkzeuge wie index++ aus dem swish++ Paket um Welten besser geeignet.
Swish kann pwr Browser abgefragt werden so ähnlich wie in
http://localhost/dwww/ (da wird htdig verwendet) nachdem man dwww installiert
hat.
Vielleicht ist ja auch bereits dwww und somit http://localhost/dwww/man/ genau
das was du suchst um manpages zu durchforsten.
Ich bevorzuge alleine schon aus Gründen der Geschwindigkeit Swish++, es muss
zwar zur Indizierung immer wieder aufs neuie angestossen werden, dafür ist es
aber extrem schnell beim Suchen und sehr sehr leistungsfähig was die
verschiedenen Formate angeht die es verarbeiten kann. Auch ist Swish++ in der
Lage in einer ganzen Reihe unterschiedlichen Formate die Ergebnisse wieder
auszugeben.
Mir ist es egal ob ein Werkzeug zur indizierung aus Gründen der Kompatibilität
mit Windows #NET in Mono programmiert wurde nur um zu zeigen das es auch
unter Windows läuft wie beagle oder ob es wie tracker als Machbarkeitsstudie
seine Daten in lokalen mysql Datensätzen ablegt.
Für mich muss ein Indizierungswerkzeug in erster Linie schnell Ergebnisse
liefern und dann sollte es das System nicht lahmlegen wenn es mal wieder neu
indiziert (wie es beagle und teilweise auch tracker tut). Search und Index
aus dem Swish++ Paket tun dies.
Beide Vorgaben erfüllt Swish++ bei mir nun schon seit einigen Jahren zur
vollsten Zufriedenheit.
Ich muss allerdings dazu sagen das die index-Dateien von Swish++ recht gross
werden können, was aber der Geschwindigkeit bisher kenen nennenswerten
merkbaren Abbruch getan hat.
Aus apt-cache show swish++
SWISH++
Simple Document Indexing System for Humans: C++ version SWISH++ is a
Unix-based file indexing and searching engine (typically used to index and
search files on web sites). It was based on SWISH-E although SWISH++ is a
complete rewrite.
SWISH++ features:
* Lightning-fast indexing
* Indexes META elements, ALT, and other attributes
* Selectively not index text within HTML or XHTML elements
* Intelligently index mail and news files
* Index Unix manual page files
* Apply filters to files on-the-fly prior to indexing
* Index non-text files such as Microsoft Office documents
* Modular indexing architecture
* Index new files incrementally
* Index remote web sites
* Handles large collections of files
* Lightning-fast searching
* Optional word stemming (suffix stripping)
* Ability to run as a search server
* Easy-to-parse results format
Homepage: http://homepage.mac.com/pauljlucas/software/swish/
regards,
thomas