-
Die
"/robots.txt" Datei des Standorts verhindert Zugang zum Dokument.
-
Das
Dokument hat einen "fdse Roboter" oder "Roboter" Metakennzeichnen
mit einem Wert von "keiner" oder "noindex".
-
Die
Dokument Dateien größe ist weniger als die "Minimalseitengröße"
Einstellung.
-
Der
Web-Server gab eine Nicht-Textinhaltsart zurück. Nur FDSE akzeptiert
Textarten wie "Text/html" und "Text/Ebene". Andere Inhaltsartenwerte
schließen "Abbildung/gif" ein und "Bewerbung/msword". Diese
Einschränkung trifft zu, um Realms, Dateien gefütterte Realms
und Web-SiteRealms mit Crawlerentdeckung zu öffnen. Es gilt nicht
für Web-SiteRealms mit Filesystem Entdeckung noch zu LaufzeitRealmsn.
-
Das
Dateien system kehrte zurück falsch für Perl sind "sind
TextDatei" testen, gewußt auch als das T Test. Für Dateien
Systementdeckung verwendet FDSE diesen Test statt der Inhaltsartenbeschränkungen.
Dieses Benehmen kann mit der Einstellung "AllowBinaryFiles" außer
Kraft gesetzt werden.
-
Der
URL ist zuvor spidered gewesen, und es gab einen Fehler zurück
oder ein Umleitung. Dies verursacht in FDSE einen Eintrag in die schwarzer
Liste der URL.
Wenn
ein URL blacklisted ist, können Sie diese immer noch direkt eintragen
durch manuellen Eintrag "neue Seite hinzufügen", oder "neuen
Standort hinzufügen"
-
Jedoch
fordert der Crawler diese URL nicht proaktiv wenn es auf Verbindungen
zu dieser Seite stößt. oder
wenn ein ganzer Standort zu indizieren ist, weil er erwartet, daß
solch ein reqest fehlschlagen würde. Auch wenn das Verhalten
dieser Seite sich später ändert wird sie von FDSE immer
noch nicht besucht auch wenn der Index wiederaufbaut wird.
-
Um
zu erlauben das FDSE diese Seite wieder besucht müssen Sie es
dem Index direkt durch manuelle Eingeben der URLs "neuen Standort
hinzufügen" oder Sie müssen die schwarze Liste löschen
und dann den Index wiederaufbauen. Um die schwarze Liste zu löschen
gehen Sie zu "User Interface "= >" Datenlagerung" = > "klarer
Fehlercache".