Kalju Euroopasse ja Vaprus üleminekule ehk Miks statistika ja reaalsus ühte jalga ei käi? (2)
Juuni keskel sai välja toodud Premium liiga kuus võtmeküsimust ja vastatud nendele küsimustele statistika põhjal. Nüüd, kui hooaeg on läbi, võime enamiku toonastest vastustest välja naerda ning piirduda uuele hooajale mõeldes üheainsa küsimusega:
Kas aasta 2023 oli läbi ja lõhki anomaalne või on meie analüütilised tööriistad ebaadekvaatsed?
Sel suure neliku lõhki ajanud hooajal ei olnud küsimus ju mitte lihtsalt ühes suurüllatajas või ootamatus põrujas. Üllatustulemusi kogunes nii palju, et lõpuks ei üllatanud need enam kedagi, ning kaks eikusagilt välja ilmunud autsaiderit ähvardasid kahe tavapärase tippklubi staatust kuni viimase vooruni. Üks Eesti kõrgliiga ajaloo suurimaid üllatuspomme lõhkeski, kui Tallinna Kalev jättis Paide Linnameeskonna ja Nõmme Kalju enda seljataha.
- Ära unusta valida hooaja parimaid ja halvimaid! SUUR HÄÄLETUS lõppeb sel nädalal
Vähe sellest, et miski ei suutnud selliseid jõuvahekordade nihkeid hooaja eel ette ennustada – ka poole hooaja möödudes ei väljendanud statistilised näitajad uut reaalsust, vaid ennustasid hooaja teiseks pooleks harjumuspärase status quo taastumist. Selle kinnituseks piisab, kui heidame pilgu juunis esitatud küsimustele ja vastustele:
1) Mille poolest Flora ja Levadia teistest peajagu üle on?
Toonane vastus: väravate löömise poolest.
Tänane reaalsus: Hooaja teises pooles lõid ka liidrid eeldatust vähem väravaid. Eriti kehtib see Flora kohta, kes lõi juunist alates koguni 10 väravat vähem kui eeldatud, samas kui Levadia näitaja kukkus 3 värava võrra. See ei takistanud neil jätkuvalt liiga domineerimist ega vääranud Flora tiitlivõitu. Premium liiga edukaimaks väravavõimaluste realiseerijaks kerkis lõpuks hoopis Pärnu Vaprus, kuid see ei toonud pärnakatele võitluses eurosarjapääsme nimel edu.
2) Mis on Kalevi ja Vapruse välkstardi taga?
Toonane vastus: Kalevil õnn(?), Vaprusel raudne kaitse.
Tänane reaalsus: Juunis sai välja toodud Vapruse madalat sisselastud väravate xG-d ning Kalevi puhul nende toimivat mänguplaani, olgugi et statistilised näitasid viitasid ka parajale õnne osakaalule. Reaalsuses vajusid aga Vapruse kaitsenäitajad hooaja teises pooles ära, samal ajal kui Kalev jätkas samas vaimus lõpuni välja ega lasknud end statistilisest ootusest üldse häirida.
3) Kas Paide või Kalju võib tõesti esinelikust välja jääda?
Toonane vastus: väga vähetõenäoline.
Tänane reaalsus: Statistika järgi pidanuks Paide ja Kalju omama järgnevate ees juunis 7- kuni 8-punktilist edumaad. Hooaja lõpuks kasvas eeldatav vahe 10-12 punkti peale. Reaalset tabelit ei huvitanud sellised ootused aga sugugi.
4) Kuidas Trans ja Tammeka gaasipedaali üles leidsid?
Toonane vastus: ründajad toidavad.
Tänane reaalsus: Tristan Koskori väravahoog ei raugenud hooaja teisel poolel, nagu ka mitte Kevin Mätase ja talle appi saabunud Ahmed Adebayo Basheri hoog. Ent nagu esimese küsimuse juures, nii selgus ka siin, et väravate löömine ei saanud sugugi nii otsustavaks nagu eeldatud. Transi ja Tammeka puhul läks tabeliseisu poolest pigem vastupidi.
5) Miks Kuressaare kiratseb?
Toonane vastus: ei kiratsegi, aga standardid ei toida.
Tänane reaalsus: See on kuuest vastusest ilmselt ainus, mis hooaja lõpuks ka täielikult kinnitust leidis. Kuressaare resultaat võis küll olla eelmise hooajaga võrreldes pettumus, kuid 43 punkti on nende jaoks siiski soliidne saak. Ning veel parem resultaat võis tõesti jääda standardolukordade taha, sest kui penaltid kõrvale jätta, siis lõid ainult Narva Trans ja Harju JK Laagri standarditest vähem väravaid kui Kuressaare.
6) Kas Harju ongi nii nõrk nagu tabel näitab?
Toonane vastus: ei ole.
Tänane reaalsus: Mingil määral osutus ka see vastus tõeseks, sest Harju arenes hooaja käigus ja ei jäänud kaugele, et viimaselt tabelirealt pääseda. Ent statistika ei suutnud nii jõulist stsenaariumit ette näha, hinnates Harjut siiski nii juunis kui ka nüüd Premium liiga selgelt nõrgimaks meeskonnaks, olgugi et mitte nii mäekõrguse mahajäämusega kui hooaja alguse tabel väljendas.
Need juunikuised hinnangud tuginesid suures osas Wyscouti statistikaraportites pakutavatele näitajatele xG ja xPoints. Lühidalt öeldes väljendab xG tekitatud väravavõimaluste alusel eeldatavat väravate hulka. Löödud ja lüüa lastud xG alusel arvestatakse omakorda välja tõenäoline punktijaotus igale mängule, misläbi kujuneb välja xPoints ehk eeldatav punktide hulk, mille meeskond väravavõimaluste jaotuse kohaselt pidanuks koguma.
Nagu iga statistiline näitaja, nii vajavad ka xG ja xPoints usaldusväärseks kasutamiseks parajat valimit, aga tüüpiliselt peaks 30+ mängu sisaldav liigahooaeg selleks piisav olema. Kuna juunis erines xPoints tugevalt sellest, mis vaatas meile vastu reaalsest liigatabelist, siis näis mõistlik eeldada, et hooaja lõpuks muutub tabeliseis statistilise ootuse suunas.
Tegelikkuses on aga tabeliseis nüüd veel oluliselt rohkem eeldatavate tulemustega vastuolus kui hooaja keskpunktis. xG ehk sisselastud väravate osas võib seda selgitada kvaliteetsete ründemängijate nappus, mis põhjustabki loodud väravavõimaluste alla ootuste realiseerimist. xPointsi puhul ei tohiks aga ründajate tase erilist rolli mängida, nii et veelgi kasvanud käärid ootuste ja reaalsuse vahel tekitavad hämmeldust.
Ainult kahe Premium liiga klubi xPoints on hooaja lõpuks lähemal reaalsele tabeliseisule kui see oli juunis: Paide on liikunud ligi 3 punkti võrra ootuspärase resultaadi suunas ning Kuressaare 2 punkti võrra. Samal ajal on aga näiteks Vapruse punktihulga lahknevus statistilisest ootusest paisunud ligi 7 punkti võrra ning Tammekal suisa ligi 15 punkti võrra.
Just Tammeka on statistika kohaselt kõige õnnetum meeskond Premium liigas. Väravavõimaluste järgi pidanuks tartlaste väravate vahe olema 16,9 võrra parem ja teenitud punktide hulk 15,8 võrra kõrgem kui reaalne lõpptulemus.
Kõige õnnelikumad meeskonnad olid statistika kohaselt aga FCI Levadia ja Pärnu Vaprus. Levadia väravate vahe oli 13,6 võrra parem ja punktide hulk 10,5 võrra kõrgem kui eeldatud. Vapruse väravate vahe oli koguni 17,4 võrra üle ootuste ning punkte teeniti 10,2 võrra rohkem kui eeldatud.
Kuigi üldiselt oleme me harjunud eeldama, et õnnefaktor tasandub hooaja jooksul ega mängi lõpptabelis suurt rolli, siis Wyscouti xPoints arvestus väidab meile hoopis midagi muud.
Eeldatavate punktide järgi oleks suur nelik jäänud kindlalt valitsema ning näiteks Vaprus peaks praegu valmistuma üleminekumängudeks, samal ajal kui reaalselt eelviimaseks jäänud Tammeka pidanuks lõpetama hooaja lähemal viiendale kohale kui üheksandale.
See kõik toob meid tagasi põhiküsimuse juurde: miks? Läheb see hooaeg ajalukku kui meeletu statistiline anomaalia nagu Leicester City meistritiitli hooaeg Inglismaal? Või on meie analüütilised tööriistad niivõrd ebaadekvaatsed, et sedalaadi statistikale ei peaks tõsist tähelepanu pöörama?
Väravavõimaluste kasutamine eeldatavate väravate ja tulemuste hindamiseks on kiiresti populaarsust võitnud meetod. Esineb küll erinevaid arusaami detailide osas, näiteks kas penalteid tuleks vaadelda xG-st eraldi või kuidas tuleks käsitleda samal rünnakul sooritatud pealelööke, kuid üldjoontes on see mõõdik tänaseks laialdaselt omaks võetud ja kiidetud.
Kas probleem võib seisneda statistika koostajates? Välistada seda ei saa, sest Wyscouti täpsed meetodid, asjatundlikkus või hoolikus on meile teadmata. Samas aga on ikkagi tegemist jalgpallianalüütika alal hiiglasega, mis neelas hiljuti alla ka InStati, mida me varasemalt olime õppinud kasutama ja usaldusväärseks pidama. Teadaolevalt ei paku keegi teine Eesti liiga kohta nii põhjalikku statistikat.
Ka väljakul nähtu viitab sellele, et Paide ja Kalju peaks tegelikult olema tasemelt Kalevist ja Vaprusest üle. Kalev oli omavahelistes mängudes tulemuste poolest küll üliedukas, kuid sellele vaatamata hindasid kihlveokontorid Kalevit ka veel sügisel Paide ja Kaljuga kohtudes selgeks autsaideriks. Siinkohal ei maksa analüütikute asjatundlikkuses ja hoolikuses kahelda, sest vastasel juhul võinuks kontorid kaotada suuri summasid ja koefitsientide koostajaid ähvardanuks töö kaotamine. Tõsi, koefitsientide määramisel mängivad mingit rolli ka näiteks varasemad panustamismustrid, nii et pole põhjust kihlveokontorite hinnanguid päris lõplikuks tõeks lugeda.
Ent oli see hooaeg siis üks suur anomaalia? See näib tõenäolisem kui analüütikute täielik puussepanek, aga usutavasti mängivad siin lisaks rolli ka jalgpalli eripärad, mis jätavadki analüütikud tihtipeale pika ninaga. Jalgpallimängu ettearvamatus tingib tavatult suure variatsiooni, mis võib nõuda korralikult väljasõelumiseks veel suuremat valimit kui üks jalgpallihooaeg. Lisaks võib jalgpall sisaldada täiesti tundmatuid ja ennustamatuid tegureid nagu näiteks taktikalised uuendused, mängijate vaheline klapp või kasvõi tribüünidelt ammutatav enesekindlus.
Igal juhul on uuele hooajale mõeldes nüüd ehk isegi kõige põnevam küsimus just see, kas ootuspärased jõudude vahekorrad taastuvad või olemegi me jõudnud uude reaalsusse ja statistika ei ole võimeline nii suuri nihkeid ette nägema.