Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

Link zu der Vergleichsansicht

Beide Seiten, vorherige Überarbeitung Vorherige Überarbeitung
Nächste Überarbeitung
Vorherige Überarbeitung
gf_informatik:daten:diagramme:luegen [2022-05-11 05:20] hofgf_informatik:daten:diagramme:luegen [2025-05-05 07:36] (aktuell) – [Kuchendiagramm] hof
Zeile 3: Zeile 3:
 Diagramme sind ein geniales Werkzeug, um grosse Datenmengen intuitiv erfassbar zu machen. Weil sich der Betrachter dabei auf den visuellen Eindruck verlässt, können Diagramme auch dazu benutzt werden, Sachverhalte zu verzerren: wir können Unterschiede übertreiben, so dass sie viel grösser als tatsächlich erscheinen, oder die Verhältnisse von zwei Grössen ins Gegenteil verkehren. Es lohnt sich also, sich bei jedem Diagramm die Frage zu stellen, ob die Autorin interessiert ist an einer redlichen Darstellung des Sachverhalts, oder ob sie andere Interessen hat. Diagramme sind ein geniales Werkzeug, um grosse Datenmengen intuitiv erfassbar zu machen. Weil sich der Betrachter dabei auf den visuellen Eindruck verlässt, können Diagramme auch dazu benutzt werden, Sachverhalte zu verzerren: wir können Unterschiede übertreiben, so dass sie viel grösser als tatsächlich erscheinen, oder die Verhältnisse von zwei Grössen ins Gegenteil verkehren. Es lohnt sich also, sich bei jedem Diagramm die Frage zu stellen, ob die Autorin interessiert ist an einer redlichen Darstellung des Sachverhalts, oder ob sie andere Interessen hat.
  
-Wir haben bereits das **[[https://www.callingbullshit.org/tools/tools_proportional_ink.html|Prinzip der proportionalen Tinte]]** kennengelernt: Werden gefüllte Flächen (nicht Linien) dargestellt, sollen die Flächen proportional sein zur dargestellten Zahl.+### Prinzip der proportionalen Tinte
  
-Das Prinzip lässt sich übrigens auch mit einem Säulendiagramm verletzen. Was ist im folgenden Diagramm falsch?+Wir haben bereits das **[[https://www.callingbullshit.org/tools/tools_proportional_ink.html|Prinzip der proportionalen Tinte]]** kennengelernt: Werden gefüllte Flächen dargestellt, sollen die Flächen proportional sein zur dargestellten Zahl. Die Regel gilt für alle Diagramme, die irgendwie gefüllte Flächen enthalten, nicht nur Flächen-, sondern auch Säulen- und Balkendiagramme. 
 +#### Kuchendiagramm 
 + 
 +Betrachte das folgende Diagramm - wie gross sind ist der Anteil der PMS Kreuzlingen? Wie gross jener der Kantonsschule Kreuzlingen? 
 + 
 +{{:gf_informatik:daten:diagramme:luegen:pasted:20250505-070506.png?nolink&480}} 
 + 
 +Kontrolliere anschliessend im untenstehenden Diagramm deine Schätzungen: 
 + 
 +++++Kuchendiagramm mit Prozenten| 
 +{{:gf_informatik:daten:diagramme:luegen:pasted:20250505-070720.png?nolink&480}} 
 +++++ 
 + 
 +Ein 3D-Kuchendiagramm verfälscht die wahrgenommenen Werte, weil der 3D-Rand und die Perspektive den vorderen Bereich überbetont. Das Prinzip der proportionalen Tinte wird verletzt. 
 + 
 +Kuchendiagramme sind selten die richtige Wahl - sie erlauben es, den Anteil ein paar weniger Werte am Ganzen darzustellen. 
 + 
 +#### Säulen 
 + 
 +Was ist im folgenden Diagramm falsch?
  
 {{:gf_informatik:daten:pasted:20220510-213513.png?nolink&600}} {{:gf_informatik:daten:pasted:20220510-213513.png?nolink&600}}
  
 ++++Lösung:| ++++Lösung:|
-Die vertikale Achse wurde gekürzt und beginnt bei 100. Visuell entsteht der Eindruck, der Männeranteil sei auf einen Bruchteil zurückgegangen, obwohl immer noch die Mehrheit des Nationalrats männlich ist.+Die vertikale Achse wurde gekürzt und beginnt bei 100 statt bei null. Visuell entsteht der Eindruck, der Männeranteil sei auf einen Bruchteil zurückgegangen, obwohl immer noch die Mehrheit des Nationalrats männlich ist.
 ++++ ++++
  
-Mit der **Kürzung der Achse** lässt sich ein Unterschied visuell dramatisieren, auch wenn es sich um ein Liniendiagramm handelt. Dies wird auch in der Politik immer wieder gerne verwendet:+Eine **gekürzte Achse** kann bei einem Liniendiagramm sinnvoll sein, wenn es um den (zeitlichen) Verlauf eines Wertes geht, und nicht um das Verhältnis von zwei unterschiedlichen Werten. Beispielsweise macht es Sinn, eine Fieberkurve nicht bei null beginnen zu lassen, weil dann die Temperaturunterschiede sehr klein werden: 
 + 
 +{{:gf_informatik:daten:diagramme:pasted:20220514-165415.png?nolink&400 }} {{ :gf_informatik:daten:diagramme:pasted:20220514-165512.png?nolink&400}} 
 + 
 +<WRAP clear/> 
 +#### Absicht und Wirkung 
 + 
 +Mit der *Kürzung der Achse* lässt sich ein Unterschied aber auch visuell dramatisieren, wenn es sich um ein Liniendiagramm handelt. Dies wird auch in der Politik immer wieder gerne verwendet:
  
 {{:gf_informatik:daten:pasted:20220510-214513.png?nolink&600}} {{:gf_informatik:daten:pasted:20220510-214513.png?nolink&600}}
Zeile 20: Zeile 46:
  
 ++++Was ist hier problematisch?| ++++Was ist hier problematisch?|
-  * die Achse ist gekürzt (immerhin so ausgewiesen), der Unterschied zwischen "rot" und "blau" beträgt ca. 8%, nicht mehr als 100% wie suggeriert+  * die Achse ist gekürzt, was bei einer Liniengrafik grundsätzlich in Ordnung sein kann. 
-  * Verurteilungsdaten machen nur Sinn, wenn sie im Verhältnis zu der Grundgesamtheit ("Ausländer" bzw. "Schweizer") gestellt werden - es wäre zum Beispiel sehr einfach, eine Grafik zu erstellen, die zeigt, dass es viel mehr verurteilte Zürcher als Appenzeller gibt.+  * Die Grafik fokussiert aber nicht auf den zeitlichen Verlauf, sondern auf den Vergleich der beiden Datenreihen. Das Diagramm suggeriert einen Unterschied zwischen "rot" und "blau" von über 100% für 2018 - real beträgt er aber nur $\frac{41742-38603}{38603} \approx 8\%$
 +  * Verurteilungsdaten machen nur Sinn, wenn sie im Verhältnis zu der Grundgesamtheit ("Ausländer" bzw. "Schweizer") gestellt werden - es wäre zum Beispiel sehr einfach, eine Grafik zu erstellen, die zeigt, dass es viel mehr verurteilte Zürcher als Appenzeller gibt, weil die Zürcher Grundgesamtheit viel grösser ist. 
 +    * Korrekt wäre: ein Vergleich der relativen Verurteilungsraten (Anzahl Verurteilungen / Anzahl Personen) der betrachteten Gruppen. 
 ++++ ++++
 +
  
 ### Aufgabe: Lügen mit Diagrammen ### Aufgabe: Lügen mit Diagrammen
  
-Erstelle zwei Diagramme+Erstellt in Zweiergruppen ein Diagramm, und "beweist" damit einen selbstgewählten aber falschen Sachverhalt. Verwendet mindestens eine dieser drei Möglichkeiten
-  - eines, das das *Prinzip der proportionalen Tinte* verletzt+  * Verletzt das *Prinzip der proportionalen Tinte*
-  - eines mit gekürzter Achse+  * Kürzt die Achse in unstatthafter Weise. 
 +  * Stellt zwei Grössen zusammen dardie nicht verglichen werden können. [[https://tylervigen.com/spurious-correlations|Hier findet ihr Beispiele von gefälschten Korrelationen und Erläuterungen dazu, wie sie erstellt wurden]]. 
 + 
 +#### Ziele 
 +Hauptziel: Stellt eine falsche Behauptung möglichst überzeugend dar; anschliessend versuchen eure Kolleg:innen eure Lügen zu entlarven. 
 + 
 +Zusatzpunkte: 
 +  * Ihr kombiniert eigene und fremde Daten. 
 +  * Ihr kombiniert mehrere Methoden, um überzeugender zu lügen. 
 +  * Eure Behauptung ist nicht auf den ersten Blick als Lüge erkennbar. 
 + 
 +#### Inspiration 
 + 
 +  * Genügende vs. ungenügende Noten im Semester 
 +  * Verurteilungen pro Jahr von Appenzellern und Zürchern 
 +  * Zusammenhang von Bitcoin Performance und Erdtemperatur 
 +  * Zusammenhang von eurer Notenentwicklung und dem Börsenkurs von Tesla 
 +  * Stelle Covid-Erkrankungen oder -Spitaleinweisungen entweder als dramatischer oder weniger schlimm dar, als sie in Wirklichkeit waren. 
 + 
 +#### Datenquellen 
 + 
 +Es finden sich viele Daten im Internet - selber suchen! 
 + 
 +Ein paar Ideen: 
 +  * Bundesamt für Statistik: [[http://bfs.admin.ch|bfs.admin.ch]] 
 +  * Crypto Currency historical data: [[https://coinmarketcap.com/de/currencies/bitcoin/historical-data/|coinmarketcap.com]] 
 +  * Börsenkurse: von Aktien und Währungen: am einfachsten [[https://support.google.com/a/users/answer/9308730?hl=de|direkt in Sheets mit GOOGLEFINANCE]] 
 +  * Covid: Unter [[https://www.covid19.admin.ch/|covid19.admin.ch]] Statistiken anschauen, unten **Daten herunterladen** finden und **Daten als \*.csv** wählen. 
 +  * Erdtemperatur: z.B. [[https://datahub.io/core/global-temp|datahub.io/core/global-temp]]
  
-Ziel: Stelle einen selbstgewählten Sachverhalt möglichst überzeugend dar. Ideen: 
-  * Bitcoin Performance 
-  * Notenentwicklung 
-  * ... 
  • gf_informatik/daten/diagramme/luegen.1652246431.txt.gz
  • Zuletzt geändert: 2022-05-11 05:20
  • von hof