Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Beide Seiten, vorherige Überarbeitung Vorherige Überarbeitung Nächste Überarbeitung | Vorherige Überarbeitung | ||
gf_informatik:daten:processing:dictionaries [2023-05-24 07:54] – [Aufgabe 3: Zwei Datasets kombinieren] hof | gf_informatik:daten:processing:dictionaries [2024-06-10 12:30] (aktuell) – hof | ||
---|---|---|---|
Zeile 6: | Zeile 6: | ||
Wie wir wissen, können wir in einem (sortierten) Wörterbuch (Diktionär) effizient suchen: | Wie wir wissen, können wir in einem (sortierten) Wörterbuch (Diktionär) effizient suchen: | ||
- | * Der Suchbereich wird fortlaufend halbiert (s.a. Binäre Suche in [[gf_informatik: | + | * Der Suchbereich wird fortlaufend halbiert (s.a. Binäre Suche in [[gf_informatik: |
* Bei $n$ Einträgen benötigt die Suche nach einem Element nur $log_2(n)$ Zugriffe, also | * Bei $n$ Einträgen benötigt die Suche nach einem Element nur $log_2(n)$ Zugriffe, also | ||
* $10$ Zugriffe für $1024$ Elemente, | * $10$ Zugriffe für $1024$ Elemente, | ||
Zeile 90: | Zeile 90: | ||
### Aufgabe 2: CSV in ein Dictionary einlesen | ### Aufgabe 2: CSV in ein Dictionary einlesen | ||
- | Lies die Datei [[https:// | + | Lies die Datei [[https:// |
Die Daten sehen so aus: | Die Daten sehen so aus: | ||
Zeile 102: | Zeile 102: | ||
</ | </ | ||
- | Hinweis: | + | Hinweise: |
* Die PLZ steht zuerst, also an `values[0]` | * Die PLZ steht zuerst, also an `values[0]` | ||
* Der Ort ist an zweiter Stelle, also `values[1]` | * Der Ort ist an zweiter Stelle, also `values[1]` | ||
- | * Wir wollen ein umgekehrtes Dictionary von Ortsnamen zu PLZ. | + | * Wir wollen ein **umgekehrtes** Dictionary von Ortsnamen zu PLZ. |
- | * Ein Ortsnamen kann mehrere Postleitzahlen haben - wir möchten immer die erste behalten (also `1000` für Lausanne, nicht `1005`). | + | * Ein Ortsnamen kann mehrere Postleitzahlen haben - wir möchten immer die kleinste |
<nodisp 2> | <nodisp 2> | ||
Zeile 127: | Zeile 127: | ||
++++ | ++++ | ||
</ | </ | ||
+ | |||
+ | |||
### Aufgabe 3: Zwei Datasets kombinieren | ### Aufgabe 3: Zwei Datasets kombinieren | ||