MÄNGUD
UUDISED
EILE
TÄNA
HOMME

Logi sisse

Sotsiaalmeedia kontoga portaali sisenemiseks pead sisestama õige salasõna ja kasutajanime ning nõustuma oma andmete jagamisega Soccernetiga.

Soccerneti kontoga portaali sisenemiseks logi eelnevalt foorumisse sisse ning seejärel kliki portaalis Soccerneti sisselogimisikoonil.

Olles foorumi mobiilivaates, saab portaali tagasi, kerides lehe lõppu ning klikkides "Portaal".

ARVAMUS/KOMMENTAAR
Link kopeeritud

Siim Pulst | Mõned mõtted tunnetuse ja andmete vastuoludest hinnangute kujundamisel

Link kopeeritud
Siim Pulst pilt
Siim Pulst
Siim Pulst pilt
Siim Pulst

On veepudel pooltäis või pooltühi? Selle üle võib lõputult vaielda ja ongi vist hea. Foto: Liisi Troska / jalgpall.ee

Jürgen Henni ja Thomas Häberli statistilisele võrdlusele osaks saanud tähelepanu oli ootamatult suur. Järgnenud reaktsioonide hulk ja mitmekesisus andsid tunnistust sellest, et hinnang Eesti koondise hetkeseisule ei ole sugugi ühetimõistetav. Kelle jaoks rääkisid numbrid tegelikkusele vastu, kelle jaoks tõid need tegeliku pildi just esile.

Isiklikult ei oma ma tugevat arvamust kummaski suunas. Kuulun selle enamuse hulka, kelle jaoks on Henn teinud koondise vaatamise uuesti lootusrikkaks ja meeldivaks. Samas esineb mängudes omajagu hoiatavaid märke, mis muudavad koondisele suunatud kiidulaulu kohati põhjendamatult valjuks.

Ma ei oodanud Henni ja Häberli statistikat kõrvutama hakates, et numbrid näitaksid erilist edasiminekut, aga kindlasti ei oodanud ma sealt ka niisuguseid kääre eelmise peatreeneri kasuks pea kõigi näitajate osas, nagu lõpuks välja tuli. Sellega seoses vältisin ma oma loos järske hinnaguid ja otsisin läbi artikli põhjendusi, miks statistika võib välja paista liiga sünge.

Olen igati nõus, et Hennile tuleb anda aega oma visiooni realiseerimiseks. Selle loo eesmärgiks ei olnud treeneri kritiseerimine, vaid tähelepanu juhtimine ebakõladele, mis koondisele jagatavates hinnangutes välja paistsid. Vahepeal näis, et kõigi õnnestumiste puhul viidatakse tohutule edasiminekule võrreldes Häberli ajaga, samas kui kõigi puuduste osas otsitakse vabandusi, miks nendest võrdlustest hoiduda.

Viimase koondiseakna ajal puhkenud kriitilised arutelud on tervitatavad, sest kui ka Aserbaidžaanis näidatud mängupilt ei oleks tekitanud küsimusi, siis oleks avalik arvamus küll reaalsusest väga kaugele irdunud. Niisiis on mul hea meel, kui see statistiline võrdlus toetas neid arutelusid ja et hinnanguid on esitatud seinast seina, aga ise seisan ma toa keskel ja jään äraootavale seisukohale.

Argumente on esitatud mõlema suuna toetuseks väga erinevaid ja mul ei ole neile midagi lisada. Küll aga tahaksin ma siin välja tuua mõned viimase nädala jooksul kogunenud mõtted, mis puudutavad tunnetuse ja andmete vastuolusid hinnangute kujundamisel laiemalt.

Kohtunikud on alati Jose Mourinho vastu? Vaevalt saab see tõsi olla. Foto: Scanpix / Tolga Bozoglu / EPA

Tunnetuse ebausaldusväärsus

Palju aastaid tagasi proovisin ma töötada välja mudelit, mis ennustaks Eesti liigamängude tulemusi täpsemalt kui kihlveokontorid. Mudelit testides tekkis probleem: kuidas sõeluda piiratud valimi juures välja õnnetegur ehk kuidas või millal saab kindel olla, et mudel töötab või ei tööta? Täieliku kollanokana tulin ma siis fantastilisele ideele märkida iga mudeli poolt tuvastatud väärtuspanuse juurde "tagantjäreletarkuse lahter", kus ma annan ise mängu näinuna võimalikult objektiivse hinnangu sellele, kas panus oli kasumlik või mitte. Idee poolest pidi see ümmargusest pallist tingitud juhuslikkust oluliselt vähendama.

261 panuse kogutulemuseks oli 13-protsendiline miinustootlus, mis on väga halb tulemus. "Tagantjäreletarkuse lahter" ütles aga, et 154 panusest (ülejäänud 107 panust puudutasid mänge, mida ma ise ei näinud) koguni 83 olid tegelikult head panused, 26 ei head ega halvad ning ainult 45 halvad panused. Niisiis tuli välja, et ma olen ilmselt kõige õnnevaesem inimene maailma ajaloos ning kui õnnetegur välja sõeluda, siis pidanuks mu mudel tegelikult näitama võimsat plussi!

"Tagantjäreletarkuse lahter" lendas mõistagi prügikasti, aga see kujutas endast ka väärt õppetundi. See polnud mulle küll uudiseks, et isiklikud huvid moonutavad inimese reaalsustaju (näiteks valdav enamus autojuhtidest arvab, et nemad on keskmisest paremad juhid), aga antud juhul olid minu otseseks huviks ju justnimelt võimalikult objektiivsed hinnangud, et toetada kasumliku mudeli väljatöötamist.

Selgus, et kaasavõetud eeldused ja soovmõtlemine mõjutavad hinnanguid nii tugevalt ja paratamatult, et isegi konkreetne püüdlus jalgpallimängus toimuvat objektiivselt hinnata ebaõnnestub lootusetult.

Kui mängija raiskab hea võimaluse, siis ei paku statistikale viitamine lohutust. Foto: Oliver Tsupsman

Andmete ebausaldusväärsus

Aga ka faktilised andmed ei paku hinnangute jagamiseks kõigutamatut alust. Alustada võiks sellest, et teadusfilosoofid on faktiliste järelduste olemasolu üldse küsimärgi alla seadnud. Üldiselt aktsepteeritakse küll deduktiivset (ehk puhtalt abstraktset, loogilist, matemaatilist) tõesust, kuid et deduktiivset arutlust saaks rakendada käegakatsutavale maailmale, selleks vajab see ka induktiivset (kogemuspõhist) sisendit. Induktiivsete faktide kehtivuses on aga alati võimalik kahelda, viidates näiteks ammendamatule andmehulgale või vahelduvatele paradigmadele.

Praktilisemad probleemid andmete usaldusväärsuse osas seonduvad peamiselt asjakohase valimiga ja sellega, milliseid järeldusi üksikutest andmekildudest tegelikult teha saab. Valimi probleem ei kao jalgpalli hindamisest, sest mäng ise ja keskkond on pidevas muutumises, mistõttu vanemad andmed muutuvad üha ebausaldusväärsemaks ning uusi andmeid ei tule enamike hinnangute põhjendamiseks piisavalt kiiresti peale.

xG ehk eeldatavat väravate hulka arvutav statistiline mõõdik hiilib ümber asjakohase valimi probleemi, sest seda arvutatakse löögipositsioonide põhjal, mille kohta pakuvad erinevad jalgpalliliigad ühtekokku tohutut andmepanka. See ei räägi aga kogu tõde, sest löögipositsioonil ja löögipositsioonil on vahe sees, sõltudes näiteks lööja ja vastasmeeskonna tasemest, kaitsjate ja väravavahi asetsemisest, söödu kvaliteedist, enesekindlusest, väljaku kvaliteedist, kõikvõimalikest segavatest asjaoludest ... seda loetelu teguritest, mida xG ei saa täielikult arvesse võtta, võiks jätkata sisuliselt lõputult.

Ometi on teadatuntud fakt, et xG statistika ennustab tulevaste mängude väravate hulka paremini kui tegelike väravate statistika. Niisiis on see taseme hindamiseks adekvaatsem mõõdik kui tegelikud resultaadid, olgugi et kindlasti mitte ideaalne. Näiteks see kolme aasta tagune artikkel jõudis järeldusele, et Premier League'i andmete alusel sünnivad täpseimad ennustused hoopis siis, kui arvestada xG-d 70% ulatuses ja reaalset väravatehulka 30% ulatuses.

Lõppude lõpuks on aga iga jalgpallimäng eripärane ja üldistused ei pruugi ühe mängu kontekstis suurt midagi maksta. Pealegi komistame me ka xG-d kasutades uuesti valimi probleemi otsa, kui võtame vaatluse alla ainult loetud kohtumised.

Jürgen Henn vastas kriitikale professionaalselt ja paraja enesekriitilisusega. Foto: Liisi Troska / jalgpall.ee

Enesekriitiline kesktee

Sellest arutlusest ilmnevad huvitavad paradoksid. Ükskõik kui ebausaldusväärne subjektiivne tunnetus ka ei oleks, siis sõltuvalt olukorra eripärast on see lõpuks ikkagi just tunnetuse küsimus, millisel määral tasub andmetele tugineda. Samas jookseks me ilmselt väga kiiresti rappa, kui faktilised andmed üldse tähelepanuta jätta.

Samas jällegi varitseb inimloomusest tulenevalt alati oht moonutada statistikat enda tunnetust kinnitavaks - tõlgendada faktilisi andmeid kas vääralt või ületähtsustada neid mõõdikuid, mis toetavad olemasolevaid eelduseid ja narratiive. Tunnetuse ja andmete vahel laveerides tuleb kogu aeg jalge ette vaadata ja enesekriitilisus säilitada. Seda muidugi eeldusel, et eesmärgiks on tõeotsing ja mitte isiklike seisukohtade iga hinna eest läbisurumine.

Väga emotsionaalsete valdkondade puhul, mille alla jalgpall kahtlemata kuulub, on äärmuslikud seisukohad kiired tekkima ja ka kiired muutuma. Uusi treenereid kantakse tavaliselt kätel, vanu treenereid tambitakse pahatihti mutta. Tõde on tavaliselt palju igavam.

Lõpetan Veiko Veskimäe sõnadega hiljutisest intervjuust Postimehele, mida on selle teema käsitlemisel juba tsiteeritud, aga mis sobib ka siia kui rusikas silmaauku: "[K]ui kõik tundub hästi, siis tegelikult kõik pole, ja kui kõik tundub halvasti, siis samuti pole."

SEOTUD LOOD

SEOTUD LOOD

Henn ja Häberli aserite ja rootslaste vastu - mida räägivad numbrid?
EESTI MEESTE KOONDIS 9

Henn ja Häberli aserite ja rootslaste vastu - mida räägivad numbrid?

Naiste A-koondis
Suur mäng Inglismaal
Uue bossi otsingul
Premium liiga
Kalev jäi püsima
Läbi ajaloo
Parimad-parimad-parimad
Asjad klaariks
Jutud stuudiost
A. LE COQ PREMIUM LIIGA 2024
  • 1 Tallinna FCI Levadia 87
  • 2 Nõmme Kalju FC 72
  • 3 Paide Linnameeskond 72
  • 4 Tallinna FC Flora 70
Vaata veel
VAATA KOGU TABELIT
POPULAARSEMAD UUDISED
LOETUMAD
KOMMENTEERITUMAD
OTSEÜLEKANDED

Soccernet.ee selle nädala otseülekanded:

VIIMASED UUDISED
KÕIK
EESTI
VÄLISMAA