0

Hallo Ihr netten Menschen,

ich habe ein Problem mit dem Lösungsvorschlag zu dieser Aufgabe (Siehe Bild mit blauen Schrift). Also ich versuche so gut es geht mein Problem darzustellen..

Ich habe die Tabelle, die in der Aufgabe angegeben ist fortgesetzt indem ich auf der unteren horizontalen Achse die Werte aufsummiert habe (hj) und das gleiche rechts auf der vertikalen Achse (hi) 

Mein Problem ist nun, wie mein Prof. bei dem ersten Satz: "Bestimmen Sie f(b1 | a2) und f(a2 | b3)" auf die Ergebnisse:

(b1 | a2) = 50%. f(a2 | b3) = 25% gekommen ist. Die zweite Teilaufgabe habe ich verstanden (Ich weiß zwar nicht wieso da nur die Abhängigkeit von (a2 I b3) überprüft wurde und nicht die (b1 I a2) ) 
Das wären für die:  f(b1 | a2) = (16 * 12) / 30= 6,4 
                               f(a2 | b3) = (12 * 4) / 30= 1,6  

Um diesen Roman zu beenden fasse ich nochmal meine Fragen zusammen, sorry:
1. Wie kommt man auf die (b1 | a2) = 50%. f(a2 | b3) = 25% ?
2. Hat das einen bestimmten grund, wieso danach nur die Abhängigkeit von  f(a2 | b3) überprüft wird?
3. Falls eine Lösung nicht "ungleich" 1 ist, bedeutet das dann immer "unabhängigkeit"? oder wurde die "1" vorher berechnet?

gefragt

Student, Punkte: 108

 
Kommentar schreiben
1 Antwort
0

Hallo,

mit der Häufigkeitsverteilung kenne ich mich nicht wirlich aus, aber ich würde es mal aus der Stochastik übertragen. Ich denke, dass \( f\) bei euch für die relative Häufigkeit oder Wahrscheinlichkeit steht oder? Für die bedingte Wahrscheinlichkeit gilt

$$ P(A|B) = \frac {P(A\cap B)} {P(B)} $$

Da die relative Häufigkeit gleich einer Wahrscheinlichkeit ist, sollte gelten

$$ f(a_i |b_j )= \frac {f(a_i , b_j)} {f(b_j)} $$

und analog

$$ f(b_j |a_i) = \frac {f(a_i , b_j)} {f(a_i)} $$

Wir berechnen also zuerst die relativen Häufigkeiten und können dann in die Formel einsetzen. \( f(a_i,b_j) \) ist dabei die relative Häufigkeit, dass \( a_i \) und \( b_j \) gleichzeitig gelten. Also beispielsweise

$$ f(a_1,b_2) = \frac 5 {30} = \frac 1 6 $$

Außerdem steht \( f(a_i )\) bzw. \( f(b_j)\) für die relative Häufigkeit des Merkmals \( a_i \) bzw \( b_j\). 

Damit komme ich auf die angegebenen Lösungen. 

Für die stochastische Unabhängigkeit muss

$$ P(A) \cdot P(B) = P(A \cap B) $$

gelten. Wieder entspricht die relative Häufigkeit der Wahrscheinlichkeit. Wenn wir wissen wollen, ob die Merkmale unabhängig sind, dann müssen vermutlich alle \( a_i \) und \( b_j \) unabhängig sein. Deshalb wird hier einfach ein Gegenbeispiel gezeigt. Wir nehmen dafür \( a_2 \) und \( b_3 \). Damit muss, wenn die Merkmale unabhängig sind, folgendes gelten

$$ f(a_2) \cdot f(b_3) = f(a_2, b_3) $$

Daraus resultiert

$$ f(a_2) \cdot f(b_3) = \frac 2 5 \cdot \frac 2 {15} = \frac 4 {75} \neq \frac 1 {30} =  f(a_2, b_3) $$

Wenn wir jetzt beide Seiten mit \( n=30 \) multiplizieren, erhalten wir

$$ 30 \cdot \frac 4 {75} = 1{,}6 $$

und

$$ 30 \cdot \frac 1 {30} = 1 $$

und das ist genau die Zeile in der Lösung. Ich denke also, das \( h \) für die absolute Häufigkeit steht. Um von der absoluten Häufigkeit auf die relative zu kommen, müssen wir ja

$$ \frac {h(x)} n = f(x) $$

Wenn wir also meine Gleichung 

$$ f(a_2) \cdot f(b_3) = f(a_2, b_3) $$

durch \( n \) teilen, erhalten wir

$$ h(a_2) \cdot f(b_3) = h(a_2,b_3) \Rightarrow \frac {h(a_2) \cdot h(b_3)} n = h(a_2,b_3) $$

Ich hoffe das ist alles soweit verständlich. Wenn nicht, melde dich gerne nochmal.

Grüße Christian

Diese Antwort melden
geantwortet

Sonstiger Berufsstatus, Punkte: 29.81K

 

wow, vielen Dank, dass Sie sich soviel mühe geben.
Die 1,6 und 6,4 sind auf jeden Fall deutlich nachvollziehbarer. Ich weiß nur nicht wie ich die Formel anwenden kann dass ich diese 50% und die 25% erreiche.
  ─   sann 18.12.2020 um 14:38

Sehr gerne, freut mich das ich helfen kann :)
Wir brauchen für die Bedingte relative Häufigkeit zwei Werte. Einmal die relative Häufigkeit, das beide Ereignisse eintretten und einmal die relative Häufigkeit, dass das Ereignis unter dessen Bedingung das andere Ereignis eintritt.
Also \( f(b_1 | a_2 ) \) bedeutet ja die relative Häufigkeit für das Ereigniss, dass \( b_1 \) eintritt, nachdem \( a_2 \) bereits eingetreten ist.
Wir suchen also die relative Häufigkeit, dass \( b_1 \) und \( a_2 \) gleichzeitig eintreten (\(f(a_2, b_1\), vielleicht noch als Anmerkung: \(f(a_2, b_1) = f(b_1 , a_2) \). Diese Häufigkeit können wir anhand der Tabelle ablesen. Es ist genau dort, wo sich diese beiden Ereignisse treffen.
Vorsicht: du hast bei dir die absolute Häufigkeit gegeben. Wir brauchen zuerst die relative Häufigkeit. Es mag sein, dass es auch eine Formel für die absolute Häufigkeit gibt, aber die kenne ich nicht und möchte da jetzt auch nicht zu sehr spekulieren.
Wie ist also die relative Häufigkeit dafür, dass \( a_2 \) und \( b_1 \) beide eintreten?
Da \( b_1 \) eintreten soll, nachdem \( a_2 \) bereits eingetreten ist, suchen wir noch die relative Häufigkeit für \( a_2 \), also \( f(a_2) \). Das sind alle Häufigkeiten, in denen \( a_2 \) vorkommt. Wo steht dieser Wert in deiner Tabelle (Hinweis, er steht in deiner ergänzten Tabelle aber noch nicht in der der Aufgabe).
Der Quotient dieser Werte ergibt dann \( \frac 12 = 0{,}5 = 50\% \).
  ─   christian_strack 18.12.2020 um 15:24

Ja gut das macht verdammt viel Sinn. Selbst wenn man von der relativen Häufigkeit ausgeht und \( f(x) \) durch \( \frac {h(x)} n \) ersetzt, kürzen sich die Gesamtmengen ja raus. Hätte ich vielleicht doch etwas spekulieren können ;p
Ich danke dir für die Ergänzung. :)
  ─   christian_strack 18.12.2020 um 15:53

Vielen Dank ! sehr hilfsbereit :-)   ─   sann 19.12.2020 um 09:56

Kommentar schreiben