| |
allgemeine
Empfehlungen
Die folgenden
Realms Konfiguration sollte für die meisten Leute arbeiten. Es nimmt
an, daß FDSE eine kleine Sammlung von Web-Sites und Dokumenten über
ein einzelnes Thema indiziert hat. Es nimmt an, daß die Mehrheit
von Fragen alle Realms durchsucht:
-
Entscheiden
Sie auf dem Umfang Ihr Suchmaschine, das heißt, welchen Inhalt
es bedeckt. Bedenken Sie, daß FDSE nur etwa 10.000 Dokumente
handhaben kann.
-
Für
jede ganze Web-Site indizierte, zu schaffen ein "Web-Site - Crawlerentdeckung"
Realm.
-
Wenn
es auch einige einzelne Dokumente gibt, die durchsucht werden sollten,
ein einzelnes "offenes Realm" schafft und jene hinzufügt, ist
verschiedener URL dazu.
Andererseits,
wenn FDSE auf Bedeckung installiert wird, trennen mehrere Themen, verwenden
diese Strategie. Dies nimmt an, daß die meisten Fragen gegen ein
bestimmtes Realm im dropdown ausgewählten Kasten gemacht werden und
daß die "alle" Wahlmöglichkeit sogar entfernt worden sein könnte:
-
Entscheiden
Sie auf dem Umfang Ihr Suchmaschine, das heißt, welchen Inhalt
es bedeckt. Bedenken Sie, daß FDSE nur etwa 10.000 Dokumente
pro Suche handhaben kann. Auf diese Art kann jeder ThemenbeRealm dieses
sicher halten viel dokumentiert, wenn die Option, um alle Themen zu
durchsuchen, entfernt ist.
-
Für
jedes Sachgebiet schaffen Sie ein offenes Realm.
-
Gehen
zu "User Interface " = > "verwalten Realms" = > und ermöglicht
die Einstellung "erlauben Index ganzen Standort".
-
Verwendete
die "neuen URL hinzufügen" Form, um dem diesem Sachgebiet gewidmeten
offenen Realm jeden Standort oder jedes Dokument hinzuzufügen.
Für Seiten überprüfen Sie das checkbox kennzeichnete
"ganzen Standort indizieren." (die "neuen Standort hinzufügen"
Form nicht, da das automatisch ein separates Web-SiteRealm schafft,
statt die vorhandenen offenen Realms zu verwenden, verwenden).
Notiz:
wenn sie jedes offene Realm wiederaufbaut, kann die "Wiederherstellung"
Funktion verwendet werden, um alle einzelnen Dokumente wieder zu indizieren.
Um völlig alle Seiten wieder zu indizieren, die seit der letzten
Wiederherstellung hinzugefügte Addition von Dokumenten einschließend,
muß der Verwalter dem offenen Realm den Standort mit Hilfe der
"neuen URL hinzufügen" Form mit "ganzen Standort indizieren"
wieder hinzufügen, ermöglicht.
Andere
Arten des Gebrauchs können spezielle Konfigurationen von Realmsn,
aber die zwei Konfigurationen oben erfordern, sollte die Arbeit für
meist.
Arten
von Realmsn
FDSE verwendet
den Begriff von "Realmsn", um Gruppen von Dokumenten zu organisieren.
Jede der fünf Realmsarten ist für einen anderen Zweck entworfen.
-
offenes
Realm
Das
offene Realm kann eine Vielfalt von Dokumenten enthalten. Es ist ein
flexibles Realm. Wenn Sie hinzugefügten Besucher ermöglichen,
ist URL, dann ein offenes Realm muß geschaffen werden, um jene
zu akzeptieren, URL ist.
Es
wird beabsichtigt, daß diese Realmsart ein Sortiment von Dokumenten
von verschiedenen Web-Sites einschließt. Wenn Sie alle Dokumente
über eine gegebene Web-Site einschließen wollen, dann würde
eines der Web-SiteRealms stattdessen empfohlen.
Diese
Art des Realms ist in Freeware Modus nicht verfügbar, obwohl
alle Anderen sind.
-
Dateien
gefüttertes Realm
Das
Dateien gefütterte Realm enthält den Satz aller direkt von
einem einzelnen Starterdokument verbundenen Dokumente.
Diese
Art des Realms kann verwendet werden, um alle die in Ihren Verbindungen
aufgeführten Seiten leicht zu indizieren, paginieren zum Beispiel.
Diese Art des Realms wird auch weithin mit computererzeugten Starterdokumenten
als ein Weg zu programmatically verwendet definieren welch URL-wird
in einem Index sein.
-
Web-SiteRealm
- Crawlerentdeckung
Diese
Art des Realms schließt alle Dokumente über einen einzelnen
Standort ein. Um alle die Dokumente über den Standort zu finden,
zieht der Crawler Verbindungen von Seiten heraus. Auf diese Art enthält
diese Art des Realms nur Dokumente, die direkt oder indirekt von der
Hauptseite verbunden werden.
-
Web-SiteRealm
- feilen Systementdeckung
Diese
Art des Realms schließt alle Dokumente über einen einzelnen
Standort ein. Um alle Dokumente zu finden, öffnet FDSE programmatically
Ordner und durchsucht die Liste von Dateien in jedem Ordner. Auf diese
Art sind alle Dokumente eingeschlossen, ob sie verbunden sind oder
nicht. Diese Art des Realms kann nur für Web-Sites auf demselben
physischen Server wie die FDSE Maschine durchsuchen verwendet werden.
-
LaufzeitRealms
LaufzeitRealms
sind identisch "Web-SiteRealm - feilen Systementdeckung" außer
dem für diese der Index wird jedes Mal wiederaufgebaut, wenn
ein Besucher eine Suche durchführt. Wegen diesem sind die Suchergebnisse
immer aktuell.
Es
könnte sein, daß diese Art des Realms nützlich ist,
wenn für einen kleinen Ordner von Dokumenten gegolten, die häufig
aktualisiert werden. Sonst ist diese Realmsart äußerst
ineffizient und verwendet übermäßige Ressourcen.
Definition
der "Web-Site" zum Zweck Realms
FDSE nimmt
an, daß eine Web-Site ein Ordner ist, und schloß ganz Dokumente
über einen gegebenen Web-Server ein. Folgendes sind Beispiele für
Web-Sites:
http://www.xav.com/http://www.nickname.net/~ foobar/http://xav.com/scripts/search/help/
In der
Liste von Realmsarten erwähnen wir das "LaufzeitRealm" und wie sind
umspannt eine ganze "Web-Site". In Übung konnte ein Verwalter ein
LaufzeitRealm in einem gegebenen subfolder haben, das nur einige häufig
sich ändernde Dateien indizierte. Der Verwalter konnte dann ein effizienteres
Web-SiteRealm schaffen, um alle die anderen Dateien und Ordner auf demselben
Server zu behandeln.
Vergleich
von Entdeckungs-/Zugangsmethoden
NetzCrawler
Verwendet
mit: Freies, gefütterte Datei und Web-Site-/CrawlerRealms
Vorteile:
Der
Crawler greift auf eine Web-Seite gerade wie ein Web-Browser durch Machen
einer HTTP-Verbindung, Senden eines Ersuchens und Syntaktischanalysieren
der Antwort zu. Auf diese Art tendieren die mit einem NetzCrawler erhaltenen
Ergebnisse dazu, genauer zu sein.
Der
NetzCrawler muß auf programmatically generierten Seitenn,
wo jede einzigartige Web-Seite ist verwendet werden bestimmt von einer
FrageString wie "default.asp ? id = 10 "anstatt" file_10.html".
Nachteile:
Den
NetzCrawler zu verwenden, ist mehr Ressourcen-intensiv als einfach eine
Datei zu öffnen. Ein Realm mit Hilfe der NetzCrawlerentdeckung
wiederaufzubauen, dauert 5-10mal länger als das Dateien system
zu verwenden.
Der
NetzCrawler kann den Unterschied zwischen Dokumenten, die aktualisiert
worden sind, und jenen nicht sagen das hat nicht. Auf diese Art, wenn
es Realms wiederaufbaut, muß jedes Dokument völlig wieder
verarbeitet werden. Dies vergrößert die schon ressourcenintensive
Natur dieser Arten von Realmsn.
Dateien
system
Verwendet
mit: Web-Site-/Dateien system- und LaufzeitRealms
Vorteile:
Entdeckung
feilt, das Dateien system zu verwenden, ist umfassend. Alle Dateien
sind eingeschlossen, nicht nur jene verbanden in HTML.
Ordner
und Dateien inhalte zu navigieren, ist schnell und effizient.
Die
Dateien systementdeckungsmethode erlaubt FDSE, wegen der wahren letzten
Aktualisierungszeiten von Dateien zu befragen. Unter bestimmten Umständen
schneidet FDSE kurz VergangenheitsDateien , die nicht seit der letzten
Wiederherstellung des Realms aktualisiert worden sind. Dies verbessert
die Aktualisierungsgeschwindigkeit.
Nachteile:
Diese
Methode wird nicht für dynamische Ausgabe empfohlen. Im allgemeinen
können PHP, PL, CGI, Natternseiten diesen Weg usw. indiziert werden,
aber nur wenn der dynamische Teil der Datei für geringfügige
Dinge wie eingebettete Anzeigen oder Kopfsprung-/Fußzeilenblöcke
verwendet wird. Wenn der Großteil der Textdaten selbst dynamisch
eingeführt wird, wie dadurch, daß es von einer Datenbank
gezogen wird, dann sollte diese Methode nicht gebraucht sein, weil es
nur den Quellencode und nicht die Ausgabe von der Datei indiziert.
Diese
Methode indiziert alle Dokumente in der Ordnerhierarchie, solange sie
mit Hilfe des Dateien systems zugänglich sind. Wenn ein Ordner
gegen Netzzugang dadurch geschützt worden ist, eine Apachen.htaccess
Datei zu verwenden, zum Beispiel dann kann die Suchmaschine immer noch
die Datei indizieren, obwohl Besucher nicht in der Lage wären,
der Verbindung in den Suchergebnissen zu folgen. Dies kann sogar empfindliche
Daten zeigen. Verwalter sollten die Liste von indizierten Seiten mit
dem Dateien system überprüfen und Dateien oder Ordner entfernen,
die nicht Besuchern zugänglich sein sollten. (FDSE ist geplant,
dieses Fasten zu machen, und leicht gewesen, aber es kann die Arbeit
nicht für Sie machen.)
Jeder
Ordner auf Unix-Systemen muß die "Lesegenuß" Bewilligung
gewähren lassen, bevor die Dateien systementdeckungsmethode seine
Dateien aufzählen kann. Wenn die Ordner nur 711 Bewilligungen haben
(arbeiten, aber nicht lesen), dann läßt FDSE ihren Inhalt
weg, ohne jede Fehlermeldung in der Verwaltungsbenutzerschnittstelle
zu liefern.
Geschichte:
vor FDSE Version R2.0.0.0031 gab es nur zwei Arten von Realmsn, "entfernten
Realmsn" und "lokalen Realmsn", die "offenen Realmsn" entsprachen, und
"Web-SiteRealms - feilen Systementdeckung", beziehungsweise.
|
|