A. LE COQ PREMIUM LIIGA
MEESTE KOONDIS
NAISTE KOONDIS
EESTLASED VÕÕRSIL
SOCCERNET
Jürgen Henni ja Thomas Häberli statistilisele võrdlusele osaks saanud tähelepanu oli ootamatult suur. Järgnenud reaktsioonide hulk ja mitmekesisus andsid tunnistust sellest, et hinnang Eesti koondise hetkeseisule ei ole sugugi ühetimõistetav. Kelle jaoks rääkisid numbrid tegelikkusele vastu, kelle jaoks tõid need tegeliku pildi just esile.
Isiklikult ei oma ma tugevat arvamust kummaski suunas. Kuulun selle enamuse hulka, kelle jaoks on Henn teinud koondise vaatamise uuesti lootusrikkaks ja meeldivaks. Samas esineb mängudes omajagu hoiatavaid märke, mis muudavad koondisele suunatud kiidulaulu kohati põhjendamatult valjuks.
Ma ei oodanud Henni ja Häberli statistikat kõrvutama hakates, et numbrid näitaksid erilist edasiminekut, aga kindlasti ei oodanud ma sealt ka niisuguseid kääre eelmise peatreeneri kasuks pea kõigi näitajate osas, nagu lõpuks välja tuli. Sellega seoses vältisin ma oma loos järske hinnaguid ja otsisin läbi artikli põhjendusi, miks statistika võib välja paista liiga sünge.
Olen igati nõus, et Hennile tuleb anda aega oma visiooni realiseerimiseks. Selle loo eesmärgiks ei olnud treeneri kritiseerimine, vaid tähelepanu juhtimine ebakõladele, mis koondisele jagatavates hinnangutes välja paistsid. Vahepeal näis, et kõigi õnnestumiste puhul viidatakse tohutule edasiminekule võrreldes Häberli ajaga, samas kui kõigi puuduste osas otsitakse vabandusi, miks nendest võrdlustest hoiduda.
Viimase koondiseakna ajal puhkenud kriitilised arutelud on tervitatavad, sest kui ka Aserbaidžaanis näidatud mängupilt ei oleks tekitanud küsimusi, siis oleks avalik arvamus küll reaalsusest väga kaugele irdunud. Niisiis on mul hea meel, kui see statistiline võrdlus toetas neid arutelusid ja et hinnanguid on esitatud seinast seina, aga ise seisan ma toa keskel ja jään äraootavale seisukohale.
Argumente on esitatud mõlema suuna toetuseks väga erinevaid ja mul ei ole neile midagi lisada. Küll aga tahaksin ma siin välja tuua mõned viimase nädala jooksul kogunenud mõtted, mis puudutavad tunnetuse ja andmete vastuolusid hinnangute kujundamisel laiemalt.
Tunnetuse ebausaldusväärsus
Palju aastaid tagasi proovisin ma töötada välja mudelit, mis ennustaks Eesti liigamängude tulemusi täpsemalt kui kihlveokontorid. Mudelit testides tekkis probleem: kuidas sõeluda piiratud valimi juures välja õnnetegur ehk kuidas või millal saab kindel olla, et mudel töötab või ei tööta? Täieliku kollanokana tulin ma siis fantastilisele ideele märkida iga mudeli poolt tuvastatud väärtuspanuse juurde "tagantjäreletarkuse lahter", kus ma annan ise mängu näinuna võimalikult objektiivse hinnangu sellele, kas panus oli kasumlik või mitte. Idee poolest pidi see ümmargusest pallist tingitud juhuslikkust oluliselt vähendama.
261 panuse kogutulemuseks oli 13-protsendiline miinustootlus, mis on väga halb tulemus. "Tagantjäreletarkuse lahter" ütles aga, et 154 panusest (ülejäänud 107 panust puudutasid mänge, mida ma ise ei näinud) koguni 83 olid tegelikult head panused, 26 ei head ega halvad ning ainult 45 halvad panused. Niisiis tuli välja, et ma olen ilmselt kõige õnnevaesem inimene maailma ajaloos ning kui õnnetegur välja sõeluda, siis pidanuks mu mudel tegelikult näitama võimsat plussi!
"Tagantjäreletarkuse lahter" lendas mõistagi prügikasti, aga see kujutas endast ka väärt õppetundi. See polnud mulle küll uudiseks, et isiklikud huvid moonutavad inimese reaalsustaju (näiteks valdav enamus autojuhtidest arvab, et nemad on keskmisest paremad juhid), aga antud juhul olid minu otseseks huviks ju justnimelt võimalikult objektiivsed hinnangud, et toetada kasumliku mudeli väljatöötamist.
Selgus, et kaasavõetud eeldused ja soovmõtlemine mõjutavad hinnanguid nii tugevalt ja paratamatult, et isegi konkreetne püüdlus jalgpallimängus toimuvat objektiivselt hinnata ebaõnnestub lootusetult.
Andmete ebausaldusväärsus
Aga ka faktilised andmed ei paku hinnangute jagamiseks kõigutamatut alust. Alustada võiks sellest, et teadusfilosoofid on faktiliste järelduste olemasolu üldse küsimärgi alla seadnud. Üldiselt aktsepteeritakse küll deduktiivset (ehk puhtalt abstraktset, loogilist, matemaatilist) tõesust, kuid et deduktiivset arutlust saaks rakendada käegakatsutavale maailmale, selleks vajab see ka induktiivset (kogemuspõhist) sisendit. Induktiivsete faktide kehtivuses on aga alati võimalik kahelda, viidates näiteks ammendamatule andmehulgale või vahelduvatele paradigmadele.
Praktilisemad probleemid andmete usaldusväärsuse osas seonduvad peamiselt asjakohase valimiga ja sellega, milliseid järeldusi üksikutest andmekildudest tegelikult teha saab. Valimi probleem ei kao jalgpalli hindamisest, sest mäng ise ja keskkond on pidevas muutumises, mistõttu vanemad andmed muutuvad üha ebausaldusväärsemaks ning uusi andmeid ei tule enamike hinnangute põhjendamiseks piisavalt kiiresti peale.
xG ehk eeldatavat väravate hulka arvutav statistiline mõõdik hiilib ümber asjakohase valimi probleemi, sest seda arvutatakse löögipositsioonide põhjal, mille kohta pakuvad erinevad jalgpalliliigad ühtekokku tohutut andmepanka. See ei räägi aga kogu tõde, sest löögipositsioonil ja löögipositsioonil on vahe sees, sõltudes näiteks lööja ja vastasmeeskonna tasemest, kaitsjate ja väravavahi asetsemisest, söödu kvaliteedist, enesekindlusest, väljaku kvaliteedist, kõikvõimalikest segavatest asjaoludest ... seda loetelu teguritest, mida xG ei saa täielikult arvesse võtta, võiks jätkata sisuliselt lõputult.
Ometi on teadatuntud fakt, et xG statistika ennustab tulevaste mängude väravate hulka paremini kui tegelike väravate statistika. Niisiis on see taseme hindamiseks adekvaatsem mõõdik kui tegelikud resultaadid, olgugi et kindlasti mitte ideaalne. Näiteks see kolme aasta tagune artikkel jõudis järeldusele, et Premier League'i andmete alusel sünnivad täpseimad ennustused hoopis siis, kui arvestada xG-d 70% ulatuses ja reaalset väravatehulka 30% ulatuses.
Lõppude lõpuks on aga iga jalgpallimäng eripärane ja üldistused ei pruugi ühe mängu kontekstis suurt midagi maksta. Pealegi komistame me ka xG-d kasutades uuesti valimi probleemi otsa, kui võtame vaatluse alla ainult loetud kohtumised.
Enesekriitiline kesktee
Sellest arutlusest ilmnevad huvitavad paradoksid. Ükskõik kui ebausaldusväärne subjektiivne tunnetus ka ei oleks, siis sõltuvalt olukorra eripärast on see lõpuks ikkagi just tunnetuse küsimus, millisel määral tasub andmetele tugineda. Samas jookseks me ilmselt väga kiiresti rappa, kui faktilised andmed üldse tähelepanuta jätta.
Samas jällegi varitseb inimloomusest tulenevalt alati oht moonutada statistikat enda tunnetust kinnitavaks - tõlgendada faktilisi andmeid kas vääralt või ületähtsustada neid mõõdikuid, mis toetavad olemasolevaid eelduseid ja narratiive. Tunnetuse ja andmete vahel laveerides tuleb kogu aeg jalge ette vaadata ja enesekriitilisus säilitada. Seda muidugi eeldusel, et eesmärgiks on tõeotsing ja mitte isiklike seisukohtade iga hinna eest läbisurumine.
Väga emotsionaalsete valdkondade puhul, mille alla jalgpall kahtlemata kuulub, on äärmuslikud seisukohad kiired tekkima ja ka kiired muutuma. Uusi treenereid kantakse tavaliselt kätel, vanu treenereid tambitakse pahatihti mutta. Tõde on tavaliselt palju igavam.
Lõpetan Veiko Veskimäe sõnadega hiljutisest intervjuust Postimehele, mida on selle teema käsitlemisel juba tsiteeritud, aga mis sobib ka siia kui rusikas silmaauku: "[K]ui kõik tundub hästi, siis tegelikult kõik pole, ja kui kõik tundub halvasti, siis samuti pole."
Loe Soccernet.ee kokkuvõtteid Premium liiga hooajast 2024!
Soccernet.ee taskuhääling "Pikk ette (ja ise järele)" nii helis kui ka pildis!
Soccernet.ee pikemad intervjuud, reportaažid, persoonilood, arvamused ...
20 aastat sümboolseid koosseise. Kams ja Vassiljev on troonil, Levadia tõusis Florast mööda
Soccernet.ee selle nädala otseülekanded:
Loe Soccernet.ee värskemaid eksklusiivlugusid:
Soccernet.ee heidab koostöös RefPaliga pilgu kohtunikemaailma. Mis on õige, mis on vale ja miks?