Skalenniveaus
Nominalskala
Die Ausprägungen des nominalskalierten Merkmals können nicht geordnet werden,
man kann sie nur vergleichen und abzählen.
Es handelt sich um qualitative Merkmale. Erhalten die Ausprägungen Ziffern zugeordnet,
handelt es sich nur um eine Verschlüsselung (Codierung): 1 = männlich, 2 = weiblich.
Ordinalskala
Zwischen den Ausprägungen des ordinalskalierten (rangskalierten) Merkmals existiert eine Beziehung
der Form mehr oder weniger, < oder >, besser oder schlechter.
Eine Quotientenbildung macht wenig Sinn (Beispiel Noten: 1, 2, 3, 4, 5).
Intervallskala
Die Abstände zwischen den Ausprägungen des (quantitativen) Merkmals der Intervallskala
können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen.
Beispiel: Kinderzahl, Temperatur.
Verhältnissskala
Sowohl die Abstände als auch Verhältnisse zwischen den Ausprägungen des (quantitativen) Merkmals
können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen. Beispiel: Einkommen.
Zweig-Blätter-(stem-leaf-) Diagramm
Die linke Spalte enthält als „Stämme“ die Äquivalenzklassen, in die die auf der rechten Seite als „Blätter“
dargestellten Merkmale eingeteilt werden. Beispiel: Gegeben sind die Werte 0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7.
Wählt man die Natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm:
3 | 5 | 7 | |||
2 | 5 | 5 | 6 | 7 | 8 |
1 | |||||
0 | 3 | 4 |
Lageparameter
Arithmetisches Mittel
Median (Zentralwert)
Sind die Beobachtungswerte der Größe nach geordnet, ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt.
geometrisches Mittel
harmonisches Mittel
Modalwert
Der am häufigsten auftretende Wert
Varianz
Grundgesamtheit:
Stichprobe:
Verschiebungssatz
Für jedes gilt
Damit erhält man als Varianz
Variationskoeffizient
Konzentrationsmasse
Lorenzkurve
Für eine geordnete Urliste x1 ≤ x2… ≤xn trägt man die kumulierte relative Merkmalssumme
über den Anteil der Merkmalsträger auf.
Liegen die Merkmale in gruppierter Form vor, trägt man die kumulierte relative Merkmalssumme
über der Häufigkeit auf.
Zwischen (0;0) und (1;1) wird die Winkelhalbierende des Koordinatensystems eingetragen.
Gini-Koeffizient
Als Ginikoeffizient G bezeichnet man das Verhältnis der Fläche zwischen Winkelhalbierender und der Lorenzkurve
zur Gesamtfläche unter der Winkelhalbierenden (bzw.aus Normierungsgründen einfach das Doppelte der Fläche
zwischen Winkelhalbierender und der Lorenzkurve). Die Teilflächen kann man aus Trapezflächen zusammensetzen
(&Delta p; · Mittelwert linke und rechte Differenz):
Alternativ aus einer geordneten Urliste: