Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
| Beide Seiten, vorherige Überarbeitung Vorherige Überarbeitung Nächste Überarbeitung | Vorherige Überarbeitung | ||
| talit:retrieval [2025-10-30 08:28] – [Build Your Own Google] hof | talit:retrieval [2025-11-03 18:21] (aktuell) – hof | ||
|---|---|---|---|
| Zeile 7: | Zeile 7: | ||
| * [[indexing]] | * [[indexing]] | ||
| * [[spatial]] | * [[spatial]] | ||
| + | |||
| ## Build Your Own Google | ## Build Your Own Google | ||
| Zeile 12: | Zeile 13: | ||
| {{ .: | {{ .: | ||
| - | < | + | < |
| ++++Repo| | ++++Repo| | ||
| https:// | https:// | ||
| Zeile 27: | Zeile 28: | ||
| Im Unterschied zu einem _Dictionary_ hat in einem _Index_ nicht jedes Dokument einen eindeutigen Schlüssel, sondern für einen gegebenen Schlüssel können mehrere Dokumente erfasst sein, und ein Dokument kann für mehrere Schlüssel eingetragen sein. | Im Unterschied zu einem _Dictionary_ hat in einem _Index_ nicht jedes Dokument einen eindeutigen Schlüssel, sondern für einen gegebenen Schlüssel können mehrere Dokumente erfasst sein, und ein Dokument kann für mehrere Schlüssel eingetragen sein. | ||
| - | In der nebenstehenden Abbildung sind beispielsweise für viele Einträge _mehrere_ Seitenzahlen aufgeführt. | + | In der nebenstehenden Abbildung sind beispielsweise für viele Einträge _mehrere_ Seitenzahlen aufgeführt, und die Seitenzahl 222 wird mehrfach referenziert. |
| ### Jupyter | ### Jupyter | ||
| Zeile 81: | Zeile 82: | ||
| Mit dem `tqdm`-Modul lässt sich der Fortschritt bequem darstellen. Das Modul muss einmalig z.B. mit `%pip install tqdm` installiert werden. | Mit dem `tqdm`-Modul lässt sich der Fortschritt bequem darstellen. Das Modul muss einmalig z.B. mit `%pip install tqdm` installiert werden. | ||
| - | < | + | < |
| ++++Lösung| | ++++Lösung| | ||
| <code python> | <code python> | ||
| Zeile 121: | Zeile 122: | ||
| ++++ | ++++ | ||
| - | < | + | < |
| ++++Lösung| | ++++Lösung| | ||
| Zuerst muss die Datei in `data/ | Zuerst muss die Datei in `data/ | ||
| Zeile 192: | Zeile 193: | ||
| Probiert zuerst mit dem Toy-Dataset, | Probiert zuerst mit dem Toy-Dataset, | ||
| - | < | + | < |
| ++++Lösung| | ++++Lösung| | ||