Notes about numerical confidence, popularity, etc measures

Allikas: Lambda
Numbrilised dimensioonid faktidele:

- tõenäosus:
  klassikaline kombinatsioonidega:

  mis tõenäosus on, et kahe täringu viske summa
  tuleb 2 (1/36, väike)? Aga summa 4 (3/36, suurem)?

  Bayesi reeglid, ...

  mis tõenäosus on, et täna 15:00 ja 15:10 vahel tuleb
  troll peatusse?

  statistilne mõõtmine, aasta otsa loeme kokku,
  saame keskmine 0.7

  
  mis tõenäosus on, et täna 15:00 ja 15:10 vahel tuleb
  troll peatusse, KUI ei ole samal päeval elektrikatkestust?

  kui tihti on elektrikatkestused?

    

     

  
   


  

- usaldusväärsus: kui veendunud ma olen mingis faktis Pikk(john)
  ise: panen numbri
  küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige  
   
- tugevus (fuzzy parameeter): kui "väga" see fakt kehtib (a la Pikk(john))
  küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige

  usaldusväärsus(80%,tugevus(90%,p(john(pikk))):
  
  80% tudengeid ütleb, et 90% tudengite jaoks on john pikk.
  
  - küsimus: mis protsent tudengeid vastab, et john on pikk?
    92,80,100,70,.... (vbl võtta usaldusväärsuseks keskmine?)
    
  - küsimus: kas vähemalt 90% tudengeid vastab, et john on pikk?  
    jah,ei,jah,jah,ei, ... (jahide protsent ongi usaldusväärsus)
    
- tuntus: kui paljud inimesed seda teavad

  küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige
  
  kaks varianti küsimustest:
  - tuntus: kas sa tead johni pikkust?
  - usaldusväärsus: kas john on pikk?
  
  küsime mill inimest üle maailma:
  - kas sa tead, mis on maailma kõrgeim mägi?
    saame a la 80% ütleb "jah"
    palju false positive, a la Munamägi, Kazbek, K2, ...
    
   küsime mill inimest üle maailma:
  - kas sa tead, et Dzhomolungma on maailma kõrgeim mägi?
    saame a la 70% ütleb "jah"  
  
  tuntust saab justkui mõõta objektide kohta (kas tead johni)
  usaldusväärsust nende omaduste kohta (kas on Pikk(john))
  
  usaldusväärsus: need inimesed, kellelt me küsime õiget vastust,
  kui paljud neist vastasid jah esimesele küsimusele
  
  usaldusväärsus: protsent, kes vastasid jah mõlemale
  
- populaarsus: kui paljudele inimestele see vahel pähe tuleb

  - küsimus: kas sa see nädal oled mõelnud, et 
      Dzhomolungma on maailma kõrgeim mägi?
   a la 2%         

- vastuolulisus: "maa on lame" 

  summa:
  need inimesed, kellelt me küsime õiget vastust,
  ja kes vastasid ei, (a la 20%: nad ei tea õiget vastust)
  aga samas vastasid jah esimesele küsimusele (nad
  on veednud vales vastuses, a la K2)
  
  protsent: summa / need, kes vastasid jah esimesele küsimusele
  





Bayesian: "päris tõenäosused" aga tingimuslikud

Fuzzy logic: predikaadid on sujuvad

   99%: Punane(õun2ülenipunane)
   95%: Punane(õun1)
   50%: Punane(õun1laiguline)
   
   95% Pikk(john,190)  
   70% Pikk(john,185)
   1% Pikk(john,160)