Iti0210ex10

Allikas: Lambda

Bayesi võrk

Bayesi võrk

Meil on antud Bayesi võrk järgmiste juhuslike muutujatega:

  • X - troll jääb vahele (näiteks ei välju lõpp-peatusest või läks teel rikki)
  • Y - troll tuleb hiljem (see võib olla ka järgmine troll, kui eelmine jäi vahele)
  • Z - üliõpilane hilineb eksamile

Tõnäosusjaotused:

      X=T    X=F
----------------
     0.02   0.98

X     Y=T    Y=F
----------------
T    0.97   0.03
F    0.3    0.7

Y     Z=T    Z=F
----------------
T    0.6    0.4
F    0.04   0.96

Et valemid väga kirjuks ei läheks, kirjutame lühidalt X=T asemel x ja X=F asemel -x, kui meil on valemites konkreetne muutuja väärtus.

Harjutus 1

Unustame hetkeks muutuja Z olemasolu. Leia tõenäosus, et troll üleüldse hilineb valemiga

P(y) = ∑x P(y|X)P(X) = P(y|x)P(x) + P(y|-x)P(-x)

Kommentaar: arvutuse tulemus tuleb sama ka juhul kui valemis arvestada muutujat Z.

Harjutus 2

Mis on eksamile hilinemise tõenäosusjaotus?

P(z) = α ∑xy P(z|Y) P(Y|X) P(X)

Siin tuleb summeerida üle kõigi võimalike X ja Y väärtuste kombinatsioonide. Me ei tea α väärtust, nii et arvuta S1 = ∑xy P(z|Y) P(Y|X) P(X). Siis arvuta S2, pannes valemisse P(z|Y) asemel P(-z|Y).

Selgub, et S1 + S2 = 1, α-t polegi tarvis ning P(z) = S1 ja P(-z) = S2.

Harjutus 3

Rakendame lõpuks Bayesi võrku järelduse tegemiseks. Hoolimata parimatest kavatsustest juhtus, et üliõpilane hilines eksamile. Mis on tõenäosus, et selles oli süüdi troll?

P(y|z) = α ∑x P(z|y) P(y|X) P(X)

Leia sarnaselt eelmisele harjutusele summa S1 hüpoteesi y jaoks ning S2 -y jaoks. Siin on tundmatuks suuruseks ainult X.

Leia nüüd normaliseerimiskonstant α, nii et αS1 + αS2 = 1.

Saame P(y|z) = αS1.

Teooria

Oletame et meid huvitab juhuslik muutuja Q, kui meil on vaatlusandmed e (muutujad e1, e2, ...) ja ülejäänud muutujad h on tundmatud. Q tõenäosusjaotuse saame üle h kõigi võimalike väärtuste summeerimisel Q, e ja h ühisjaotuses:

Ühisjaotuselt järeldamine

Ühisjaotus on üsna teoreetiline nähtus, kuna see on eksponentsiaalselt kasvav tabel, mille täitmiseks on vaja eksponentsiaalselt kasvavat vaatlusandmete hulka. Ühisjaotust saab aga kompaktsemalt kirjeldada Bayesi võrgu abil, kus on antud ainult muutujate seosed (xi - mingi muutuja Xi väärtus, parents(Xi) - muutujad millest Xi sõltub):

Ühisjaotuse faktoriseerimine

Kõik siin harjutuses antud valemid saab nende kahe valemi sobitamisel antud mudeliga.