Stetige Zufallsvariablen#

Eine stetige Zufallsvariable kann unendlich viele nicht Abzählbare Werte annehmen. Stetige Zufallsvariablen entstehen meist durch einen Messvorgang. Unabhängig von der Messgenauigkeit kann eine stetige Zufallsvariable innerhalb eines Intervalls unendlich viele Werte annehmen aber einen genauen Wert zu messen ist nicht wirklich möglich.

Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable $X$ einen exakten Wert $x_{i}$ annimmt ist gleich 0. Z.B. ist die Wahrscheinlichkeit das eine Person 180cm gross ist 0, weil er könnte auch 180.000000000000001cm gross sein. Weshalb es mehr Sin ergibt, dass $X$ einen Wert in einem Interval $[a, b]$ annimmt Z.B. $[179.5, 180.5]$

mehr dazu findest du hier

Dichtefunktion#

Die Wahrscheinlichkeiten von Stetigen Zufallsvariablen werden durch die Fläche unter der Dichtefunktion $f (x)$ für alle $x$ der Zufallsvariable $X$ beschrieben

P (a \leq X \leq b) = \int_{a}^{b} f (x) d x

stetigeDichtefunktion

Die Gesamtfläche unter der Dichtefunktion muss gleich 1 sein sonst ist sie nicht normalisiert

P (- \infty < X < \infty) = \int_{- \infty}^{\infty} f (x) d x = 1

Weil die Wahrscheinlichkeit von einem genauen Wert 0 ist haben abgeschlossene und offene Intervalle dieselben Wahrscheinlichkeiten

P (a \leq X \leq b) = P (a < X \leq b) = P (a \leq X < b) = P (a < X < b)

Erwartungswert#

E (X) = \int_{- \infty}^{\infty} x \cdot f (x) d x

Varianz#

E (X) = \int_{- \infty}^{\infty} (x - E (X))^{2} \cdot f (x) d x $ $ O d e r K u r z g e s c h r i e b e n g e n a u g l e i c h w i e b e i d i s k r e t e n Z u f a l l s v a r i a b l e n $ $ E (X^{2}) - E (X)^{2}

Standardabweichung#

Genau gleich wie bei diskreten Zufallsvariablen

σ (X) = \sqrt{V (X)}

Verteilungsfunktion#

Die Verteilungsfunktion ist

F (x) = P (X \leq x) = \int_{- \infty}^{x} f (y) d y

Und hat die follgende Eigneschaften

$P (a \leq X \leq b) = F (b) - F (a)$
$F^{'} (x) = f (x)$ wenn $f$ stetig ist.
$lim_{x \to \infty} F (x) = 1$
$lim_{x \to - \infty} F (x) = 0$

Stetige Verteilungen#

Nun schauen wir uns ein paar Verteilungen an die häufig vorkommen wenn man mit stetigen Zufallsvariablen arbeitet.

Stetige Gleichverteilung#

Die Stetige Gleichverteilung wird auch oft Uniformverteilung genannt. Sie hat auf dem Intervall $[a, b]$ eine konstante Wahrscheinlichkeitsdichte, dass heisst das alle Teilintervalle gleicher Länge dieselbe Wahrscheinlichkeit besitzen.

Wir schreiben dann $X \sim U [a, b]$
Die Dichte von $X$ ist $f (x) = \frac{1}{b - a}$ wobei $a \leq x \leq b$ Dies kommt davon weil die Dichte normalisiert ist und die Fläche 1 ergeben muss.
$E (X) = \frac{a + b}{2}$
$V (X) = \frac{1}{12} (b - a)^{2}$

Stetige_Gleichverteilung_Dichte

In Matlab haben wir die Funktionen:

Dichte: $u n i f p d f (x, a, b)$
Verteilungsfunktion $u n i f c d f (x, a, b)$

mehr dazu findest du hier und hier

Beispiel stetige Gleichverteilung

Eine Person kommt zu einem zufälligen Zeitpunkt zum Bahnhof. Der Zug fährt einmal pro Stunde. Wie hoch ist die Wahrscheinlichkeit, dass man höchstens 10 Minuten warten muss? Was ist die erwartete Wartezeit im Durchschnitt?

$X$ : Wartezeit, Dann ist $X \sim U [0, 60]$

Wir erhalten also: $f (x) = \frac{1}{b - a} = \frac{1}{60}$ und somit dann $F (X) = \frac{1}{60} x = \frac{x}{60}$

P (X \leq 10) = \int_{0}^{10} f (x) d x = \int_{0}^{10} \frac{1}{60} d x = \frac{x}{60} |_{0}^{10} = \frac{10}{60} - \frac{0}{60} = \frac{1}{6}

Und die erwartete Wartezeit ist $E (X) = \frac{a + b}{2} = 30$ Minuten

Normalverteilung#

Die Normalverteilung oder auch oft Gauss-verteilung oder Glockenkurve genannt, ist eines der wichtigsten stetigen Verteilungen.

Die Normalverteilung besteht aus 2 Parametern, der Erwartungswert $μ$ und die Standardabweichung $σ$ . Desto Kleiner $σ$ desto enger ist die Glockenkurve.

Wir schreiben dann $X \sim N [μ, σ]$
Die Dichte von $X$ ist $f_{μ, σ} (x) = \frac{1}{\sqrt{2 π σ^{2}}} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}}$ wobei $a \leq x \leq b$
$E (X) = μ$
$V (X) = σ^{2}$

normalVerteilungGraph

In Matlab haben wir die Funktionen:

Dichte: $n o r m p d f (x, μ, σ)$
Verteilungsfunktion $n o r m c d f (x, μ, σ)$

mehr dazu findest du hier

Beispiel Normalverteilung

Der Intelligenzquotient (IQ) ist normalverteilt und so festgelegt, dass $μ = 100$ und $σ = 15$ . Wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einen IQ zwischen 90 und 110 hat oder grösser als 150.

Es sei X der IQ der Person dann

$X \sim N (100, 15)$

$P (90 \leq X \leq 110) = P (X \leq 110) - P (X \leq 90) = n o r m c d f (110, 100, 15) - n o r m c d f (90, 100, 15) \approx 50$ %

$P (X \geq 150) = 1 - P (X < 150) = 1 - n o r m c d f (150, 100, 15) \approx 0.04$ %

Standardisierung der Normalverteilung#

Mit Standardisierung bezeichnen wir die transformation einer Normalverteilten Zufallsvariable $X$ , zu einer Zufallsvariable $Z$ welches den Erwartungswert $E (Z) = 0$ und die Varianz $V (Z) = 1$ besitzt. Dies machen wir damit wir verschiedene Zufallsvariablen besser vergleichen können und damit wir auch schneller rechnen können.

Zuerst zentrieren wir die Zufallsvariable, dies machen wir indem wir von allen ihre Elementarereignisse den Erwartungswert $μ$ abziehen. Mit Zentrieren ist hier gemeint das wir den Gipfel der funktion $f (x)$ bei der Nullstelle der x-Achse wollen.

Danach Dividieren wir die Differenz $X - μ (X)$ durch die Standardabweichung $σ (X)$ .

Z = \frac{X - μ (X)}{σ (X)}

Z.B. können wir nun $X \sim N (μ, σ)$ zu $Z \sim N (0, 1)$ umwandeln mit $Z = \frac{X - μ (X)}{σ (X)}$

mehr dazu findest du hier

Quantile#

Oftmals haben wir einen Wert $α \in [0, 1]$ gegeben. Und wir suchen nun den Wert $z_{α}$ wofür $P (X \leq z_{α}) = α$ .

Wenn $α = 0.5$ dann reden wir vom Median, auch Zentralwert, Erwartungswert und der Modus. Eine Kennzahl dafür, wo sich die "Mitte" einer Wahrscheinlichkeitsverteilung befindet.
Wenn $α = 0.25 oder 0.75$ reden wir von einer Quartile
Mit dem Perzentil schneiden wir $[0, 1]$ in 100 Teile was equivalent ist zu den Prozentanzahlen.

In Matlab haben wir die Funktionen:

$n o r m i n v (α, μ, σ)$ wobei $n o r m i n v$ English ist und für "normal inverse" steht

quantileGraph

mehr dazu findest du hier

Beispiel Quantile

Der Intelligenzquotient (IQ) ist normalverteilt und so festgelegt, dass $μ = 100$ und $σ = 15$ . Eine gewisse Schulform ist für die tiefsten 5% gedacht. Ab welchem IQ sollte man an diese Schule gehen?

$X \sim N (100, 16)$

Wir suchen also $z_{α}$ mit $P (X \leq z_{α}) = 0.05$

Dies bekommen wir mit der Matlab funktion $n o r m i n v (0.05, 100, 15) = 75.33$

Sigma-Regeln#

Für $X \sim N (μ, σ)$ gilt

$P (| X - μ | \leq σ) \approx 68.3$ %
$P (| X - μ | \leq 2 σ) \approx 95.5$ %
$P (| X - μ | \leq 3 σ) \approx 99.7$ %

Was bedeutet, dass ein Wert einer normalverteilten Zufallsvariable mit der Wahrscheinlichkeit 68% maximal um $\pm σ$ vom Erwartungswert $μ$ abweicht.

sigmaRegelnGraph

mehr dazu findest du hier

Exponentialverteilung#

Die Exponentialverteilung beschreibt zufällige Lebensdauern von Geräten oder Wartezeiten auf zufällige Ereignisse. - Lebensdauer einer Glühbirne - Wartezeit auf nächstes Erdbeben

Die Exponentialverteilung und Poisson-Verteilung haben eine enge Beziehung mit einander.

A n z a h l \sim P o i (λ) \leftrightarrow Z w i s c h e n a n k u n f t s z e i t \sim E x p (λ)

Wir schreiben dann $X \sim E x p (λ)$
Die Dichte von $X$ ist $F^{'} (x) = λ e^{- λ x}$
Die Verteilung von $X$ ist $F (x) = 1 - e^{- λ x}$
$E (X) = \frac{1}{λ}$
$V (X) = \frac{1}{λ^{2}}$

In Matlab haben wir die Funktionen:

Dichte: $e x p p d f (x, 1 / λ)$
Verteilungsfunktion $e x p c d f (x, 1 / λ)$

mehr dazu findest du hier

Beispiel Exponential-Verteilung

In einem Geschäft kommen im Schnitt 20 Kunden pro Stunde.

Wie hoch ist die Wahrscheinlichkeit, dass mehr als 30 Kunden in einer Stunde kommen? $X \sim P o i (20), P (X > 30) = 1 - p o i s s c d f (30, 20)$
Wie hoch ist die Wahrscheinlichkeit, dass man weniger als 5 Minuten auf den ersten Kunden warten muss? $T \sim E x p (20), P (T \leq \frac{1}{12}) = e x p c d f (1 / 12, 1 / 20)$

Gedächtnislosigkeit#

Die Exponential-Verteilung hat die spezielle Eigenschaft, dass sie kein Gedächtnis hat.

Was so viel heisst, wie wenn ein Gerät mit einer exponential verteilten Lebensdauer $X$ während $t$ Stunden gelaufen ist, so ist die Wahrscheinlichkeit, dass es weitere $h$ Stunden läuft gleich gross, wie wenn ein neues Gerät $h$ Stunden läuft. Dies können wir mit ein wenig Mathe und bedingte Wahrscheinlichkeiten auch beweisen

P (X \geq t + h | X \geq t) = \frac{P (X \geq t + h \cup X \geq t)}{X \geq t} = \frac{P (X \geq t + h)}{X \geq t} $ $ $ $ = P (X \geq h) = \frac{e^{- λ (t + h)}}{e^{- λ t}} = e^{- λ h} = P (X \geq h)