Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

--- gf_informatik:daten:processing:dictionaries [2022-06-16 19:54] – [Aufgabe 3: Zwei Datasets kombinieren] hof
+++ gf_informatik:daten:processing:dictionaries [2025-06-16 08:57] (aktuell) – hof
@@ Zeile 6: / Zeile 6: @@
 Wie wir wissen, können wir in einem (sortierten) Wörterbuch (Diktionär) effizient suchen:
-  * Der Suchbereich wird fortlaufend halbiert (s.a. Binäre Suche in [[gf_informatik:suchen_und_sortieren]])
+  * Der Suchbereich wird fortlaufend halbiert (s.a. Binäre Suche in [[gf_informatik:suchen_und_sortieren_2023]])
   * Bei $n$ Einträgen benötigt die Suche nach einem Element nur $log_2(n)$ Zugriffe, also
     * $10$ Zugriffe für $1024$ Elemente,
     * $20$ Zugriffe für $1024\cdot1024 \approx 1Mio$,
     * $30$ Zugriffe für $1024\cdot1024\cdot1024 \approx 1Mia$
 ### Syntax
@@ Zeile 17: / Zeile 18: @@
     * Ein Dictionary stellt eine Sammlung von `Schlüssel : Wert` Paaren dar (oder `key : value`).
     * Erlaubt direkten Zugriff auf jedes Element mit dem gewünschten *Schlüssel*.
-    * In Wahrheit benützt sie nicht binäre Suche, sondern eine noch schnellere Zugriffsart: [[wpde>Hashtabelle]].
+    * Jeder Schlüssel kann nur einmal vorkommen, Werte hingegen können mehrfach enthalten sein.
+    * In Wirklichkeit benützen Dictionaries nicht binäre Suche, sondern eine noch schnellere Zugriffsart: [[wpde>Hashtabelle]].
 Ein leeres Dictionary wird mit geschweiften Klammern erzeugt:
@@ Zeile 32: / Zeile 34: @@
 plz = zip_codes['Romanshorn']
 print(plz)
->>> 8590
 </code>
 Ein neues Element kann mit derselben Syntax angelegt werden - ist der Schlüssel bereits vorhanden, wird der Wert überschrieben:
@@ Zeile 41: / Zeile 43: @@
 zip_codes['Romanshorn'] = 8591  # Überschreibt den bestehenden Eintrag für Romanshorn
 print(zip_codes)
->>> {'Romanshorn': 8591, 'Egnach': 9322, 'Amriswil': 8580}
 </code>
+  {'Romanshorn': 8591, 'Egnach': 9322, 'Amriswil': 8580}
 Mit dem `in` Schlüsselwort kann herausgefunden werden, ob ein Schlüssel im Dictionary vorhanden ist:
 <code python>
 print('Romanshorn' in zip_codes)
->>> True
+</code>
+  True
+<code python>
 print('St. Gallen' in zip_codes)
->>> False
 </code>
+  False
 Wir können eine `for`-Schleife über die Keys in einem Dictionary schreiben:
@@ Zeile 58: / Zeile 64: @@
 for town in zip_codes:
     print(town)
->>> Romanshorn
->>> Egnach
->>> Amriswil
 </code>
+  Romanshorn
+  Egnach
+  Amriswil
 Möchten wir in der Schleife sowohl Key als auch Value haben, verwenden wir die `items()` Funktion:
@@ Zeile 68: / Zeile 74: @@
 for town, plz in zip_codes.items():
     print(plz, town)
->>> 8591 Romanshorn
->>> 9322 Egnach
->>> 8580 Amriswil
 </code>
+Romanshorn
+Egnach
+Amriswil
 ### Aufgabe 1: Dictionary Syntax
@@ Zeile 78: / Zeile 84: @@
 Schreibe Code wie die obigen Beispiele, um eine Sammlung von Postleitzahlen anzulegen.
-Wie müsste man vorgehen, wenn wir sowohl ein Mapping von Ortsnamen zu Postleitzahlen als auch umgekehrt von Postleitzahlen zu Ortsnamen haben möchten?
+Wie müsste man vorgehen, wenn wir sowohl ein Dictionary von Ortsnamen zu Postleitzahlen als auch umgekehrt von Postleitzahlen zu Ortsnamen haben möchten?
 ++++Antwort:|
@@ Zeile 86: / Zeile 92: @@
 ### Aufgabe 2: CSV in ein Dictionary einlesen
-Lies die Datei [[https://kantonsschuleromanshorn.sharepoint.com/:x:/s/FSInformatik/EfL62vFg8xxMvs54mdfoR_cBxNp-4ekpI6EpHUuaCmz_9A?e=plZlJU&download=1|plz.csv]] ein und erstelle daraus ein Dictionary von Ortsnamen zu Postleitzahl.
+Lies die Datei [[https://kantonsschuleromanshorn.sharepoint.com/:f:/s/FSInformatik/Ek-Hi_stH2RMjDa-wQN9jekBMeF_YD6rvhmibDlNglGWxw?e=Y3AX65|plz.csv]] ein und erstelle daraus ein Dictionary von Ortsnamen zu Postleitzahl.
 Die Daten sehen so aus:
@@ Zeile 98: / Zeile 104: @@
 </code>
-Hinweis:
+Hinweise:
   * Die PLZ steht zuerst, also an `values[0]`
   * Der Ort ist an zweiter Stelle, also `values[1]`
-  * Wir wollen ein umgekehrtes Dictionary von Ortsnamen zu PLZ.
+  * Wir wollen ein **umgekehrtes** Dictionary von Ortsnamen zu PLZ.
-  * Ein Ortsnamen kann mehrere Postleitzahlen haben - wir möchten immer die erste behalten (also `1000` für Lausanne, nicht `1005`).
+  * Ein Ortsnamen kann mehrere Postleitzahlen haben - wir möchten immer die kleinste behalten (also `1000` für Lausanne, nicht `1005`).
+<nodisp 1>
 ++++Code|
 <code python>
@@ Zeile 121: / Zeile 128: @@
 </code>
 ++++
+</nodisp>
 ### Aufgabe 3: Zwei Datasets kombinieren
@@ Zeile 131: / Zeile 140: @@
 ++++
-<nodisp 2>
+<nodisp 1>
 ++++Lösung:|
 <code python>
@@ Zeile 141: / Zeile 150: @@
 ++++
 </nodisp>
+### Mehr zu Dictionaries
+Du willst mehr über Dictionaries wissen und selber eines programmieren? [[dictionaries_tutorial|Schau hier]]!
 ### Nächstes Kapitel
 Weiter mit [[gf_informatik:daten:processing:maps]].