Beagle: Funktionsumfang

email.listen at googlemail.com email.listen at googlemail.com
Son Mar 18 09:59:39 GMT 2007


On Sat, 17. March 2007 20:58:31 Detlef Lechner wrote:
> Hallo UbuntuUsers,
>
> habe ich das in Synaptic richtig gelesen: Beagle kann man bisher nur im
> Firefox als Extension benutzen? Durchsuchen der manPages ist nicht
> möglich?

Nur Firefox, nein
Durchsuchen der manpages nicht möglich, auch nein. Man muss ihm nur sagen er 
soll sie zuvor indizierern. Beagle indiziert alles was man ihm befiehlt zu 
indizieren.
Übrigens Manpages werden bereits vom System indiziert. Mit 'apropos BEGRIFF' 
hast du zugriff auf alle manpages.


Allerdings hat es sehr guten Grund das kein Mensch mehr von diesem in Mono 
programmierten Monster Beagle spricht sondern dagegen beinahe alle Welt 
Tracker stattdessen empfiehlt. Vor allem auf Systemen die nicht bereits mit 
einem P-VII 12000 der neuesten CPU-Generation und 1,5PByte RAM bestückt sind 
für die Beagle als Mindestanforderung ausgelegt ist.

In der ~/.Tracker/tracker.cfg kann man festlegen das auch die manpages 
durchsucht werden sollen:
[Watches]
WatchDirectoryRoots=/home/DeinUserName;
WatchDirectoryRoots=/usr/share/man;

Ich halte es allerdings für nahezu sinnfrei Werkzeugen wie tracker die 
regelmässig aufs neue indizieren die Manpages vorzuwerfen. Manpages sind 
nahezu statisch, sie ändern sich im Vergleich zum Homeverzeichnis eines Users 
so gut wie garnicht. Für solche Verzeichnisse mit quasi statischem inhalt 
sind Werkzeuge wie index++ aus dem swish++ Paket um Welten besser geeignet. 
Swish kann pwr Browser abgefragt werden so ähnlich wie in 
http://localhost/dwww/ (da wird htdig verwendet) nachdem man dwww installiert 
hat. 
Vielleicht ist ja auch bereits dwww und somit http://localhost/dwww/man/ genau 
das was du suchst um manpages zu durchforsten.

Ich  bevorzuge alleine schon aus Gründen der Geschwindigkeit Swish++, es muss 
zwar zur Indizierung immer wieder aufs neuie angestossen werden, dafür ist es 
aber extrem schnell beim Suchen und sehr sehr leistungsfähig was die 
verschiedenen Formate angeht die es verarbeiten kann. Auch ist Swish++ in der 
Lage in einer ganzen Reihe unterschiedlichen Formate die Ergebnisse wieder 
auszugeben.

Mir ist es egal ob ein Werkzeug zur indizierung aus Gründen der Kompatibilität 
mit Windows #NET in Mono programmiert wurde nur um zu zeigen das es auch 
unter Windows läuft wie beagle oder ob es wie tracker als Machbarkeitsstudie 
seine Daten in lokalen mysql Datensätzen ablegt.

Für mich muss ein Indizierungswerkzeug in erster Linie schnell Ergebnisse 
liefern und dann sollte es das System nicht lahmlegen wenn es mal wieder neu 
indiziert (wie es beagle und teilweise auch tracker tut). Search und Index 
aus dem Swish++ Paket tun dies. 
Beide Vorgaben erfüllt Swish++ bei mir nun schon seit einigen Jahren zur 
vollsten Zufriedenheit.
Ich muss allerdings dazu sagen das die index-Dateien von Swish++ recht gross 
werden können, was aber der Geschwindigkeit bisher kenen nennenswerten 
merkbaren Abbruch getan hat.

Aus apt-cache show swish++

SWISH++ 
Simple Document Indexing System for Humans: C++ version SWISH++ is a 
Unix-based file indexing and searching engine (typically used to index and 
search files on web sites).  It was based on SWISH-E although SWISH++ is a 
complete rewrite.

SWISH++ features:
  * Lightning-fast indexing
  * Indexes META elements, ALT, and other attributes
  * Selectively not index text within HTML or XHTML elements
  * Intelligently index mail and news files
  * Index Unix manual page files
  * Apply filters to files on-the-fly prior to indexing
  * Index non-text files such as Microsoft Office documents
  * Modular indexing architecture
  * Index new files incrementally
  * Index remote web sites
  * Handles large collections of files
  * Lightning-fast searching
  * Optional word stemming (suffix stripping)
  * Ability to run as a search server
  * Easy-to-parse results format

 Homepage: http://homepage.mac.com/pauljlucas/software/swish/

regards,
thomas