Unter einer Grundgesamtheit (auch Population genannt) versteht man die Menge aller potentiellen Untersuchungsobjekte.
Den Gegenstand der statistischen Untersuchung nennt man Merkmalsträger , den Träger der interessierenden statistischen Informationen.
Hierbei kann man eine Vollerhebung oder Teilerhebung machen. Oft wird aus Kostengründen eine Teilerhebung über eine Stichprobe durchgeführt. Der Begriff ’Stichprobe’ stammt aus der Zeit, in der man mit einem Werkzeug Getreidesäcke untersuchte (und natürlich gezielt nach Mängeln suchte).
Wählt man die Stichprobe -sei dies absichtlich oder nicht- so aus, daß sie die Grundgesamtheit nicht wiedergibt, spricht man von Verzerrung oder Bias . Häufiger wird -sicherlich ungewollt- bei der Formulierung von Fragen bei Interviews ein solcher Effekt erzeugt.
Eine Möglichkeit der Verarbeitung besteht nun in der Beschreibung der Stichprobe als Mengen von Zahlen:
Beispielsweise
Die so aufgestellten Zahlenmengen bezeichnen wir als Variablen.
Formal:
Unter einer Zufallsgröße oder Zufallsvariablen X bezeichnet man eine Funktion, die den Ergebnissen eines Zufallsexperiments Werte (so genannte Realisationen) zuordnet.
Zum Beispiel kann das Zufallsexperiment des Münzwurfs als Zufallsvariable X modelliert werden. X bildet die Menge der Wurfergebnisse {Kopf,Zahl} auf die Menge der Realisationen {0,1} ab:
X(ω)= {
0, wenn ω = Kopf |
1, wenn ω = Zahl |
(Frage: Wie kann man die Ralisationen eines Würfelexperiments beschreiben ?)
Man unterscheidet zwischen diskreten und stetigen Variablen (s. Beispiele oben).
Die Bedeutung der Zufallsvariable liegt darin, dass durch sie die Verbindung zwischen dem Resultat eines Zufallsexperiments und seiner mathematischen Darstellung (Realisation) hergestellt wird. Auch lassen sich Funktionen von Realisationen des Experiments durch Zufallsvariable beschreiben.
Betrachten wir einen Würfel. Die Augenzahl X nimmt bei jedem Wurf genau einen der sechs Werte 1,2 ... , 6 an. X kann daher als Funktion angesehen werden, die jedem der Elementarereignisse genau eine reelle Zahl zuordnet.
Weiterhin kann man das zweimalige Würfeln mit einem Würfel vornehmen und beispielsweise folgende Zufallsvariable untersuchen:
X als Ergebnis des ersten Wurfes, oder
X als Ergebnis des zweiten Wurfes, oder
X als Summe der zwei Würfe.