Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Beide Seiten, vorherige Überarbeitung Vorherige Überarbeitung Nächste Überarbeitung | Vorherige Überarbeitung | ||
gf_informatik:daten:processing [2024-06-10 10:45] – hof | gf_informatik:daten:processing [2025-06-06 08:29] (aktuell) – [Aufgabe 6] hof | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
# Data Processing in Python | # Data Processing in Python | ||
+ | < | ||
{{ : | {{ : | ||
Zeile 26: | Zeile 27: | ||
* Wenn Dateien gelesen oder geschrieben werden, müssen sie beim Betriebssystem reserviert werden. Mit `with` wird sichergestellt, | * Wenn Dateien gelesen oder geschrieben werden, müssen sie beim Betriebssystem reserviert werden. Mit `with` wird sichergestellt, | ||
- | * Die Datei (hier ' | + | * Die Datei (hier ' |
+ | * Der Typ einer Datei wird über die Dateierweiterung (`.txt`, en. _extension_) bestimmt. Windows versteckt die Endungen standardmässig, | ||
* `' | * `' | ||
#### Aufgabe 2 | #### Aufgabe 2 | ||
- | Lade die Datei [[https:// | + | Lade die Datei [[https:// |
- | . | + | |
+ | ##### Encoding | ||
+ | Achtung, Mac-Users: Die Datei verwendet die Latin1-Codierung, | ||
+ | |||
+ | <code python> | ||
+ | # Specify text encoding when opening a file. | ||
+ | with open(' | ||
+ | </ | ||
## Dateien schreiben | ## Dateien schreiben | ||
Schreiben funktioniert ganz ähnlich wie lesen, aber als zweites Argument muss `' | Schreiben funktioniert ganz ähnlich wie lesen, aber als zweites Argument muss `' | ||
Zeile 65: | Zeile 75: | ||
* `split(char)` erzeugt aus einem String eine Liste von Werten, die mit dem angegebenen Trennzeichen abgetrennt sind: | * `split(char)` erzeugt aus einem String eine Liste von Werten, die mit dem angegebenen Trennzeichen abgetrennt sind: | ||
* `" | * `" | ||
- | * `strip()` gibt den selben String zurück, aber ohne Leerschläge an beiden Enden. | + | * `strip()` gibt den selben String zurück, aber ohne Leerschläge an beiden Enden: |
+ | * `" | ||
Zeile 77: | Zeile 88: | ||
<nodisp 1> | <nodisp 1> | ||
++++Lösung: | ++++Lösung: | ||
- | <code python> | + | <html>< |
- | with open(' | + | |
be = 0 | be = 0 | ||
tg = 0 | tg = 0 | ||
Zeile 90: | Zeile 100: | ||
print(" | print(" | ||
print(" | print(" | ||
- | </code> | + | </bottom-editor></ |
++++ | ++++ | ||
</ | </ | ||
Zeile 103: | Zeile 114: | ||
Allerdings funktioniert das nur, wenn der String auch wirklich eine Zahl darstellt. Sonst wird eine *Exception* geworfen; wir können sie mit `try...except` auffangen: | Allerdings funktioniert das nur, wenn der String auch wirklich eine Zahl darstellt. Sonst wird eine *Exception* geworfen; wir können sie mit `try...except` auffangen: | ||
- | <code python> | + | <html>< |
try: | try: | ||
my_number = int(" | my_number = int(" | ||
Zeile 109: | Zeile 120: | ||
except ValueError: | except ValueError: | ||
pass # executed if an exception was thrown | pass # executed if an exception was thrown | ||
- | </code> | + | </bottom-editor></ |
#### Aufgabe 5 | #### Aufgabe 5 | ||
Zeile 115: | Zeile 126: | ||
* welche Spalten (Indices) gehören zu diesen Werten? | * welche Spalten (Indices) gehören zu diesen Werten? | ||
* verwendest du `int()` oder `float()`? | * verwendest du `int()` oder `float()`? | ||
- | |||
#### Aufgabe 6 | #### Aufgabe 6 | ||
Zeile 129: | Zeile 139: | ||
++++ | ++++ | ||
- | < | + | < |
++++Code:| | ++++Code:| | ||
- | <code python> | + | <html>< |
def find_smallest_population(): | def find_smallest_population(): | ||
with open(' | with open(' | ||
Zeile 151: | Zeile 161: | ||
print(" | print(" | ||
- | </code> | + | </bottom-editor></ |
++++ | ++++ | ||
</ | </ | ||
- | < | + | < |
++++Code:| | ++++Code:| | ||
- | <code python> | + | <html>< |
- | def find_smallest_population(): | + | |
- | with open('gemeinden.csv' | + | |
- | # Search for the smallest, so start out with a value larger than any expected. | + | |
- | min_pop = 1000000 | + | |
- | town = None | + | |
- | for line in towns: | + | |
- | cells = line.split(',') | + | |
- | try: | + | |
- | # Population is in the third column, and it is an integer. | + | |
- | population = int(cells[2]) | + | |
- | if population < min_pop: | + | |
- | # We found a town smaller than the currently known smallest. | + | |
- | min_pop = population | + | |
- | town = cells[0] | + | |
- | except ValueError: | + | |
- | pass | + | |
- | return town, min_pop | + | |
- | + | ||
- | print(" | + | |
def find_largest_area(): | def find_largest_area(): | ||
with open(' | with open(' | ||
Zeile 197: | Zeile 187: | ||
print(" | print(" | ||
- | </code> | + | </bottom-editor></ |
++++ | ++++ | ||
</ | </ | ||
Zeile 207: | Zeile 197: | ||
* Wieviele Gemeinden hat der Kanton Glarus? | * Wieviele Gemeinden hat der Kanton Glarus? | ||
- | < | + | < |
++++Code:| | ++++Code:| | ||
- | <code python> | + | <html>< |
def summarize_canton(canton): | def summarize_canton(canton): | ||
with open(' | with open(' | ||
Zeile 263: | Zeile 253: | ||
summarize_canton(' | summarize_canton(' | ||
summarize_canton(' | summarize_canton(' | ||
- | </code> | + | </bottom-editor></ |
++++ | ++++ | ||
</ | </ |