Andmeanalüüsi võistlused

Allikas: Lambda

Mõtete ja ideede korral: Innar Liiv (innar.liiv ät ttu punkt ee)


Iga aasta korraldatakse lisaks klassiklastele algoritmika võistlustele ka andmeanalüüsi (machine learning, data mining, collaborative filtering) võistluseid, kus probleemistiku püstitus jaotub tüüpiliselt kahte ossa:

  • Suunatud õppimine (supervised learning)
  • Suunamata õppimine (unsupervised learning)

Esimese puhul on meil lõppeesmärk hulga sisendite puhul (X1,X2,X3 jne) ennustada ühte (Y) või enamat (Y1,Y2,Y3 jne) tunnust, mis võib olla reaalarvuline (näiteks inimese eluea hindamine 94.6 aastat) või nominaalne tunnus (jah/ei binaarne, 1,2,3,4,5 järjestatud nominaalne ehk ordinaalne).

Teise puhul tüüpiliselt peame oskama sisendeid (uuritavaid objekte/nähtusi) kuidagi grupeerida või leida lähimaid sarnaseid. Tihti on jaotus ka hägune (semi-supervised learning), kui probleemistik asub kahe ülesande vahel või näiteks lõpptulemuse klassid ei ole teineteise vastandid ega välistavad . Heaks näiteks on mingi haiguse diagnoosimine või kliendistaatusest loobumine (churn prediction). Mõlemi puhul ei ole olukord triviaalne: a) kuna haiguse mitte-diagnoosimine ei pruugi tähendada, et haigust ei ole, vaid et hetkel veel ei ole diagnoositud ning b) kõik, kes pole hetkel ettevõtte klientide hulgast lahkunud, ei pruugi olla veel lojaalsed kliendid, vaid lihtsalt "pikema närviga" lähiajal lahkujad.

Soovitatav taust: prioriteediks on huvi nähtuste ja objektide käitumise uurimise ja ennustamise vastu, tehniliselt aitab oluliselt kaasa programmeerimisoskus ning keerukamate andmestruktuuride tegemise oskus. Aga peamine on idee.

Proovin siia lehele koondada hetkel käimasolevaid ning harimise mõttes ka juba lõppenud võistlusi, mis annab tudengitele ja teistele huvistele võimaluse konverteerida oma kavalad ideede ja mõtted üsnagi mõõdetavale kujule - rahaks.

Isegi kui kõigist ei õnnestu napsata peavõitu, on teid ilmselt hea shanss õppima minna edasi parimatesse ülikoolidesse või tööle minna palju "analüütikamusklit" vajavatesse firmadesse Eestis (suvaliste näidetena - Hansapank, SEB, Sampo, PriceWaterhouseCoopers, Deloitte, mitmed investeerimisfirmad jne.jne.) ja välismaal.