Dieser Artikel gibt einen tieferen Einblick in das Training von Bots über Web-URLs und weist auf wichtige Punkte hin, die beachtet werden sollten.
Gehe zu "Bot Training"
Gib eine vollständige URL ein (zusammen mit Https://) und wähle einen der drei Web-Crawling-Modi (wie unten erklärt)
Warte, bis die URLs abgerufen und gecrawlt wurden
Wähle die URLs aus und klicke auf "Bot trainieren"
Jede URL wird trainiert und mit ihrem Status in der untenstehenden Tabelle hinzugefügt. (Warten Sie, bis alle URLs trainiert wurden, bevor Sie den Bot verwenden)
Dies ist die empfohlene Option für präzises Training. Mit der Methode der genauen URL durchsucht der Bot die angegebene genaue URL und trainiert sich selbst.
Schritte:
Wählen Sie die Option "Exakte URL".
Geben Sie die URL ein, die Sie durchsuchen möchten, und klicken Sie auf "Daten abrufen".
Die URL wird durchsucht und der Bot wird darauf trainiert und zur Tabelle der hochgeladenen Links hinzugefügt.
Trainieren Sie Ihren Bot mit einer breiteren Palette an Informationen aus einem bestimmten Bereich. Der Bot durchsucht alle Seiten und Links auf der angegebenen Domain und bietet Ihnen die Möglichkeit, auszuwählen, von welchen URLs Sie trainieren möchten.
Schritte:
Wählen Sie die Option "Alle URLs in dieser Domain".
Geben Sie die URL ein und klicken Sie auf "Daten abrufen".
Warten Sie, bis die Seiten geladen sind, und Ihnen wird eine Liste der verfügbaren URLs angezeigt.
Wählen Sie die Seiten aus, die für das Training des Bots relevant sind, und klicken Sie auf "Bot trainieren".
Während der Seitenauswahl (Schritt 4 oben) wirst du auf zwei Listen stoßen:
Neue Seiten - Frische URLs sind nicht Teil der aktuellen Trainingsdaten des Bots. Durch ihre Auswahl werden sie der Tabelle "Hochgeladene Links" hinzugefügt, sobald das Training abgeschlossen ist.
Vorhandene Seiten- URLs sind bereits Teil des aktuellen Trainings datensatzes des Bots und im untenstehenden "Uploaded Links" -Tab sichtbar. Wenn sie ausgewählt werden, werden alle ausgewählten URLs aktualisiert.

Der Bot durchsucht alle Seiten der angegebenen URL und ermöglicht es Ihnen, auszuwählen, von welchen Seiten Sie lernen möchten, basierend auf dem Vorhandensein des angegebenen Pfads in der Seiten-URL. Die weiteren Schritte sind dieselben wie bei "Alle URLs in dieser Domäne".
Alle Links/URLs, auf denen der Bot trainiert wurde, sind in der hochgeladenen Link-Tabelle sichtbar.Trainierte URLs können aktualisiert werden (der Bot wird mit den neuesten Informationen erneut trainiert) oder gelöscht werden (die Informationen werden aus der Wissensbasis des Bots entfernt).
Each URL will have one of these 3 statuses:
Daten abrufen - Der Bot trainiert erneut auf dieser URL, d.h. die Informationen der URL werden aktualisiert.
Ausbildung - Der Bot hat erfolgreich von dieser URL gelernt. Das "Zuletzt aktualisierte Daten um" ist ebenfalls sichtbar und kann verwendet werden, um festzustellen, ob eine Datenaktualisierung erforderlich ist.
Fehlgeschlagen - Der Bot konnte für diese URL nicht trainiert werden. Du kannst entweder die Seite aktualisieren und es erneut versuchen oder die URL löschen.

- URLs werden nicht sofort zur Uploaded Links-Tabelle hinzugefügt. Warten Sie, bis alle URLs in der Tabelle angezeigt werden, bevor Sie den Bot verwenden.
- Das Beibehalten von präzisen und relevanten Daten verbessert signifikant die Leistung des Bots. Überprüfe regelmäßig und entferne alte URLs aus der Tabelle der hochgeladenen Links, um bessere Antworten zu erhalten.