Error, group does not exist! Check your syntax! (ID: 28)
Komentar

Predstavljanje modela rangiranja momčadi u pojedinoj ligi

U današnje vrijeme sve više analitičkih kuća pokušava doći do sustava kojim bi ocjenjivale kvalitetu nogometnih momčadi. Motivacija je jasna: čitatelji žude za spoznajama je li njihova momčad uistinu najbolja, ima li se smisla nadati većem uspjehu i sl. Sve navedeno generira interakcije na društvenim mrežama te nitko ne želi propustiti priliku za “jeftinim” klikovima.

Nažalost, ovakva “utrka naoružanja” u svijetu javne nogometne analitike dovela je do pojave nebrojeno puno modela i tzv. power rankinga kojima se pripisuje daleko veća relevantnost nego što bi trebalo. Prije svega zbog svoje netransparentnosti koja čitateljima ne omogućuje znati što se točno vrednuje, što onda pak takve rezultate čini tek matematičkom verzijom clickbaita.

Tekst se nastavlja ispod oglasa

No kako ni Ofenziva ne bi ostala bez svoga konja za utrku, autor se ovog članka poigrao i napravio vlastiti “modelčić” čiji su rezultati već opisani u tekstu “Tko su favoriti u europskim ligama i kome raspored ide na ruku?”. Ali da bi se ipak izdvojili od ranije opisanih power rankinga, pripremljen je detaljan tehnički opis strukture modela sa svim brojkama tako da bilo koji čitatelj može reproducirati naše rezultate. Preporuka je pročitati glavni članak ovog serijala prije sljedećih odlomaka kako bi se bolje razumjelo zašto su baš kladioničarska predviđanja odabrana za kvantificiranje u ovom modelu.

Metodologija

Kao što je već rečeno, OfenzivaTM model počiva na kladioničarskim koeficijentima za pobjedu, remi i poraz na svakoj utakmici. Svi su potrebni podaci preuzeti iz arhive mrežne stranice Football-Data.co.uk. Napomena je da su korištene kvote postavljene uoči početka utakmice kada su detalji o dostupnosti pojedinih igrača već odavno poznati. Na taj se način dobiva najtočniji predviđeni omjer snaga na susretu i omogućuje uključivanje ozljeda i drugih izvannogometnih faktora u analizu.

Kako bi se kvote mogle kvalitetno interpretirati, prvo ih je potrebno pretvoriti u postotke, odnosno u šanse za pobjedu, remi i poraz svakog sudionika. Potom se dobivane postotke mora prilagoditi za ukupnu vjerojatnost svih ishoda utakmice jer kladionice, u želji da spriječe svoje igrače da profitiraju kladeći se na dva suprotna rezultata, stavljaju vigorish u svoje ponude. To znači da ako se zbroje vjerojatnosti za pobjede obje ekipe i remi, gotovo uvijek će ta brojka biti veća od 1 (ili 100 %) unatoč tome što su samo ta tri događaja moguća na jednoj ligaškoj utakmici. Proces prilagodbe rezultata opisan je u priloženoj formuli.

Sljedeći je korak pretvoriti te vjerojatnosti u očekivane bodove (xP). Za razliku od drugih modela koji očekivane bodove baziraju isključivo na očekivanim golovima (xG), dakle samo na udarcima zabilježenim na utakmici bez uzimanja u obzir ostalih elemenata igre, ovaj model očekivane bodove računa tako da vjerojatnost za pobjedu neke momčadi pomnoži za tri i potom pridoda još vjerojatnost za neodlučeni ishod. Zbog toga što ovaj model zapravo zanemaruje rezultat utakmice, već umjesto njega rabi kladioničarske kvote prije (!) iste te utakmice, modelov dojam omjera snaga uvijek će kasniti jedno kolo jer će se mišljenje kladionica o najnovijoj utakmici moći vidjeti tek sljedećeg vikenda u koeficijentima za naredni ogled. Ovo je ujedno i najveća mana našeg modela, no zanemariva s obzirom na ostale prednosti ovakvog pristupa.

Konačni rezultati modela se naposljetku dobivaju nakon još jedne obrade očekivanih bodova koja se sastoji od eksponencijalnog vrednovanja posljednjih 38 (ili 34 u ligama s 18 klubova) prvenstvenih utakmica jedne momčadi da bi se model što brže prilagodio novim trendovima uslijed važnih događaja poput ozljeda, smjena trenera i ulaznih/izlaznih transfera. Broj 38 odabran je zato što predstavlja trajanje nogometne sezone te bilo kakvo daljnje kopanje u povijest ne bi povećalo preciznost modela zbog spomenutih čestih promjena unutar klubova, već bi nepotrebno uvelo još jednu razinu kompleksnosti i smanjilo mogućnost ponavljanja rezultata i za opskurnija natjecanja. S obzirom na to da novopromovirane momčadi u lanjske dvije sezone ne odigraju 38 utakmica sve do posljednjeg kola, njima su dodane srednje vrijednosti očekivanih bodova od relegiranih momčadi iz prethodne godine.

Eksponencijalno vrednovanje funkcionira na način da se svakoj utakmici pridoda određeni značaj (engl. “weight”) koji predstavlja broj između nula i jedan. Posljednji odigrani susret ima značaj jedan, dok se za sve ostale smanjuje prema sljedećim formulama. K faktor, odnosno brzina promjene koja označava koliko će brzo svaka ranija utakmica imati manju važnost, prilagođen je, kako bi u slučaju gdje se odigralo manje od pola utakmica u novoj sezoni, ona posljednja iz potonje imala 75 % težine nasuprot najrecentnije. Kada klub prijeđe 19 utakmica u novoj sezoni, K faktor se zaključava tako da uvijek 19. najstarija utakmica ima 75 % značaja. Iako je na prvu mana ovog modela što koristi arbitrarni K faktor koji nije usklađen za što bolje predviđanje, isti je prisutan u većini najpopularnijih modela, kao na primjer u Optinom Power Rankingu, jer je donekle neizbježan ukoliko je cilj dobiti najbrže ispravljanje modela poslije velikih promjena unutar kluba.

Uvjeti opisani u prethodnom odlomku.
Indeks i = 1 predstavlja posljednju odigranu utakmicu.

Ti značaji zatim služe kako bi se pomnožili s očekivanim brojem bodova na nekoj utakmici. Kada se izračuna finalni broj bodova za posljednjih 38 susreta, oni se potom zbroje i dobiju se rezultati poput ovih na ljestvici Premier lige. Vrijedi za spomenuti da ovdje rezultati nisu prikazani u izvornom obliku već radi lakše interpretacije kao t-skor koji se temelji na standardnoj devijaciji. Format u kojem će se prikazivati rezultati podložan je promjenama pa se u njegovo objašnjavanje neće ulaziti u dubinu. Najvažnije je tek za znati da broj 50 označava sredinu uzorka, a veći ili manji t-skor od toga sugerira koliko momčad odstupa od ostatka lige, što pozitivno što negativno. Isto tako, rezultati modela nisu usporedivi između različitih liga.

Manchester City i dalje je najbolja momčad Premier lige prema vjerovanju kladionica

Prije kraja ovog nešto drugačijeg teksta na Ofenzivi, bitna je napomena da ovaj model nije i ne predstavlja se kao najprecizniji. Cilj je bio isključivo pokušati napraviti inačicu vlastite top liste čija bi metoda računanja bila razumljiva široj masi, a onima radoznalima pružila priliku proširiti njezinu upotrebu na najrazličitije lige koje neće biti redovito pokrivane na ovom portalu.

Za one koji žele znati više:

*Ako je neki dio teksta ostao nejasan, slobodni ste se javiti autoru istraživanja Mislavu Dujaku na X-u (Twitter) – @mislavdujak

Komentari

Povezano