Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

--- gf_informatik:daten_sca:maps_python [2023-06-12 15:59] – [Lösungen] sca
+++ gf_informatik:daten_sca:maps_python [2023-06-20 18:39] (aktuell) – [Aufgabe 6: Abstimmungsresultate] sca
@@ Zeile 35: / Zeile 35: @@
 Ein geschlossenes **Polygon** (Vieleckt) notiert man so:
 <code>
-"POLYGON ((x1 y1, x2 y2, x3 y3))"
+"POLYGON ((x1 y1, x2 y2, x3 y3, x1 y1))"
 </code>
 In diesem Falle erhält man natürlich ein Dreieck. Beachte hier die Verwendung von **doppelten Klammern**.
@@ Zeile 43: / Zeile 43: @@
 "MULTIPOINT ((x1 y1, x2 y2, x3 y3))"
 "MULTILINESTRING ((x1 y1, x2 y2), (x3 y3, x4 y4))""
-"MULTIPOLYGON (((x1 y1, x2 y2, x3 y3)),((x4 y4, x5 y5, x6 y6)))"
+"MULTIPOLYGON (((x1 y1, x2 y2, x3 y3, x1 y1)),((x4 y4, x5 y5, x6 y6, x4 y4)))"
 </code>
-==== WKR in Google Maps ====
+==== WKT in Google Maps ====
 Um Punkte, Linien und Polygone in Google Maps einzuzeichnen, kann man diese Formen in einem CSV-File festlegen. Dazu benötigt man die entsprechenden **Koordinaten** ($x:$ longitude/Längengrad, $y:$ latitude/Breitengrad).
@@ Zeile 74: / Zeile 74: @@
 ===== Aufgaben =====
+Arbeite *nicht* mit Excel / Google Sheets, sondern mit einem reinen **Texteditor** wie **Visual Studio Code**.
 === Aufgabe 1: Big 4 im TG ===
-Erstelle ein leeres CSV-File mit Header "Name,WKT" und füge folgende Elemente hinzu. Verwende die Koordinaten aus der Theorie oben:
+Erstelle ein leeres CSV-File mit Header "Name,WKT" und füge Punkte für die vier Gemeinden Frauenfeld, Weinfelden, Romanshorn, Kreuzlingen hinzu. Verwende die Koordinaten aus der Theorie oben:
-   * Vier Punkte für die Gemeinden Frauenfeld, Weinfelden, Romanshorn, Kreuzlingen
-   * Linie von Weinfelden nach Kreuzlingen
-   * Viereck, welches die vier Gemeinden verbindet
 Importiere das File dann in Google Maps und stelle sicher, dass alles stimmt.
@@ Zeile 94: / Zeile 91: @@
 Spielregel: Es müssen mind. zwei unterschiedliche Kontinenten vorkommen.
-=== Aufgabe 3 ===
+=== Aufgabe 3: WKT mit Python ===
 Von nun arbeiten wir wieder mit Python und dem folgenden Datensatz, der die Koordinaten aller Bahnhöfe in der Schweiz beinhaltet: {{ :gf_informatik:daten_sca:sbb_csv_json.zip |}}.
-**Ziel:** Generiere mithilfe von Python ein CSV-File für Google Maps, welches die Koordinaten einiger Ortschaften beinhaltet. Verwende den SBB-Datensatz, um die Koordinaten zu ermitteln.
+**Auftrag:**
-Ortschaften:
+   * Generiere mithilfe von Python ein CSV-File für Google Maps, welches die Koordinaten einiger Ortschaften St. Gallen, Bern und Schaffhausen beinhaltet.
+   * Verwende den SBB-Datensatz, um die Koordinaten zu ermitteln.
-   * St. Gallen
+   * Schreibe Code so, dass er auch noch funktioniert, wenn man z.B. St. Gallen durch Winterthur ersetzt.
-   * Bern
-   * Schaffhausen
 ++++Tipps|
@@ Zeile 111: / Zeile 106: @@
 . Lade den SBB-Datensatz herunter, entzippe diesen und lese diesen (JSON-Variante) ein.
-. Öffne in Python ein leeres CSV-File und schreibe den Header ("Name,WKT") hinein.
+. Öffne in Python ein leeres CSV-File und schreibe den Header ("Name,WKT") hinein. Du kannst mit `csv.reader` arbeiten oder einfach zeilenweise in das File schreiben (empfohlen).
 . Speichere die Ortschaften in einer Liste und gehe diese in einer Schleife durch.
 . In dieser generierst du den CSV-Eintrag und schreibst ihn ins File.
@@ Zeile 117: / Zeile 112: @@
 ++++
+=== Aufgabe 4: Gemeinden mit Anfangsbuchstaben ===
+. Wähle einen Anfangsbuchstaben, z.B. "W", und speichere diesen in einer Variable.
+. Ermittle nun alle Bahnhöfe, die mit diesem Buchstaben beginnen ...
+. und generiere das entsprechende CSV-File.
+. Importiere es in Google Maps, um diese anzuzeigen.
+=== Aufgabe 5: Städte mit vielen Einwohnern ===
+Identifiziere (möglichst) alle Städte mit $10'000$ Einwohnern oder mehr und zeige sie auf einer Google Map an.
+Das Problem ist, dass der SBB-Datensatz die Anzahl Einwohner nicht beinhaltet. Deshalb greifen wir auf den Gemeinden-Datensatz vom Thema [[gf_informatik:daten_sca:datenverarbeitung_python]] zu. Das Vorgehen ist in etwa so:
+. Gehe jede Gemeinde im Gemeinden-Datensatz durch und finde heraus, ob sie mehr als $10'000$ Einwohner hat.
+. Falls ja versuchst du im SBB-Datensatz die Koordinaten dieser Gemeinde zu ermitteln.
+. **Achtung:** Das geht nicht immer! Warum? Verwende deshalb `try-except`, damit der Code nicht crashed.
+. Falls du einen passenden Eintrag gefunden hast im SBB-Datensatz, schreibst du einen entsprechenden Eintrag ins CSV.
+. Optional kann man als "Name" im CSV-File nicht nur den <Gemeindenamen> sondern z.B. <Gemeindenamen (Einwohner)> anzeigen. Dann hat man eine Karte, bei der man auf die Gemeinden klicken kann und gleich die Anzahl Einwohner sieht.
+=== Aufgabe 5+ (Optional) ===
+Erweitere die letzte Aufgabe: Es fehlen noch einige Ortschaften, auch wichtige wie Zürich und Basel. Warum? Versuche den Code so zu erweitern, dass möglichst viele dieser 'problematischer' Ortschaften auch integriert werden.
+=== Aufgabe 6: Abstimmungsresultate ===
+Zu Abstimmungen kann man jeweils die detaillierten Daten im JSON-Format herunterladen. Hier der Link zu den
+[[https://opendata.swiss/de/dataset/echtzeitdaten-am-abstimmungstag-zu-eidgenoessischen-abstimmungsvorlagen|Daten der eidgenössischen Abstimmungen]]
+Hier direkt zur
+[[https://opendata.swiss/de/dataset/echtzeitdaten-am-abstimmungstag-zu-eidgenoessischen-abstimmungsvorlagen/resource/964e6c70-c3af-4c25-8d1b-88be1ea30d02|Abstimmung vom 18.06.2023]]
+. Lade den Datensatz zur aktuellsten eidgenössischen Abstimmung herunter.
+. Verschaffe dir einen Überblick: Wie ist der Datensatz aufgebaut? Tipps:
+. Mit `.keys()` kannst du sehen, welches die Schlüssel eines Dicts sind.
+. Mit `type(...)` kannst du ermitteln, um was für einen Typ es sich handelt.
+. Achtung: Der Datensatz beinhaltet ein Dict, welches Listen enthält, welches wiederum Dicts enthält u.s.w.
+. Falls du überfordert bist damit, findest du unten die Antwort
+. Finde in diesem Datensatz die Anzahl Ja-Stimmen zu allen Vorlagen in *deinem* Wohnort.
+. Finde die extremsten Gemeinden zu den jeweiligen Vorgaben: Höchste und tiefste Anzahl Ja- resp. Nein-Stimmen
+. **Zusatzaufgabe:** Stelle einen Sachverhalt von diesem Datensatz mithilfe von WKT in Google Maps graphisch dar. Beispiel: Ermittle für eine Vorlage von jedem Kanton die beiden Gemeinden mit dem höchsten Ja- resp- Nein Anteil. Erstelle dann eine Karte, die dies darstellt. Falls im Datensatz `sbb.json` die jeweilige Gemeinde nicht eingetragen ist, musst du diese halt nachschlagen.
+++++Tipps: Aufbau Datensatz inkl. Beispiel|
+<code python>
+# lade Datensatz (JSON) in ein dict mit Name data
+vorlagen = data['schweiz']['vorlagen'] # vorlagen ist Liste, Länge entspricht Anzahl Vorlagen
+vorlage = vorlagen[0] # vorlage beinhaltet alle Infos zur ersten Vorlage (erstes Element der Liste vorlagen
+print(vorlage['vorlagenTitel'][0]['text']) #  Name der Vorlage (0 für Deutsch)
+kantone = vorlage['kantone'] # Liste mit Infos zu allen Kantonen (zur gewählten Vorlage)
+kanton = kantone[3] # Infos zu einem Kanton (Zahl 0 - 25, weil 26 Kantone)
+print(kanton['geoLevelname']) # Name dieses Kantons
+gemeinden = kanton['gemeinden'] # Liste mit Infos zu allen Gemeinden in diesem Kanton (zur gewählten Vorlage)
+gemeinde = gemeinden[7] # Alle Infos zu einer Gemeinde
+resultat = gemeinde['resultat'] # Resultat
+jaStimmenInProzent = resultat['jaStimmenInProzent']
+"""
+</code>
+++++
 ===== Lösungen =====
@@ Zeile 136: / Zeile 197: @@
     for town in towns:
         out_file.write(town + ',' + '"POINT (' + sbb[town]['longitude'] + ' ' + sbb[town]['latitude'] + ')"\n')
+</code>
+++++
+++++Aufgabe 5|
+Reguläre Lösung
+<code python>
+import json
+INHABITANTS_MIN = 10000
+with open("sbb.json", "r") as json_file:
+    sbb = json.load(json_file)
+with open("gemeinden.json", "r") as json_file:
+    gemeinden = json.load(json_file)
+with open('gemeinden_min_' + str(INHABITANTS_MIN) + '.csv','w') as out_file:
+    out_file.write('Name,WKT\n') # kann alternativ auch mit csv.writer arbeiten
+    for town in gemeinden:
+        if gemeinden[town]['inhabitants'] >= INHABITANTS_MIN:
+            try:
+                out_file.write(town + ',' + '"POINT (' + sbb[town]['longitude'] + ' ' + sbb[town]['latitude'] + ')"\n')
+            except:
+                print("Fehler: ",town)
+</code>
+Mit optionalem Part:
+<code python>
+import json
+INHABITANTS_MIN = 50000
+with open("sbb.json", "r") as json_file:
+    sbb = json.load(json_file)
+with open("gemeinden.json", "r") as json_file:
+    gemeinden = json.load(json_file)
+def generate_wkt_point(town):
+    return '"' + town + '"' + ',' + '"POINT (' + sbb[town]['longitude'] + ' ' + sbb[town]['latitude'] + ')"\n'
+with open('gemeinden_min_' + str(INHABITANTS_MIN) + '.csv','w') as out_file:
+    out_file.write('Name,WKT\n') # kann alternativ auch mit csv.writer arbeiten
+    for town in gemeinden:
+        if gemeinden[town]['inhabitants'] >= INHABITANTS_MIN:
+            success = False
+            for ext in ['',' HB',' SBB']: # try different typical extensions
+                try:
+                    out_file.write(generate_wkt_point(town + ext))
+                    success = True
+                    break
+                except:
+                    continue
+            if not success:
+                for t in sbb: # if not found yet, split and try to match first part
+                    if t.split()[0] == town:
+                        out_file.write('"' + t + '"' + ',' + '"POINT (' + sbb[t]['longitude'] + ' ' + sbb[t]['latitude'] + ')"\n')
+                        print(town)
+                        break
 </code>
 ++++
 </nodisp>