tracking data tippmix vegas.hu

Tracking data és térbeli adatok a professzionális sportfogadásban

Az adatalapú sportfogadás világa az elmúlt évtizedben gyökeresen átalakult. Korábban a statisztikai elemzés legfeljebb gólátlagok és lőtt szögletek számlálásáig terjedt. Mára a sportfogadók is másodpercenként frissülő, kétdimenziós koordinátarendszerben rögzített pozíciós adatokat dolgoznak fel. Az Opta, a StatsBomb és a Wyscout által kínált tracking data és térbeli adatok (spatial data) elképesztő részletességgel tárják fel a labdarúgás belső mechanizmusait. Ez a bejegyzés bemutatja, hogy ezek az adatok hogyan működnek és miért változtatják meg alapvetően az elemzési módszertant.

Mi az a tracking data és hogyan keletkezik?

A tracking data lényege egyszerű: minden egyes játékos és a labda helyzetét x-y koordinátákban rögzítik, általában 25-50 mintavételezéssel másodpercenként. Ez azt jelenti, hogy egy 90 perces mérkőzés során közel 140 000 adatpont keletkezik. Ráadásul ez csak a pozícióadatokra vonatkozik, a sebesség, a gyorsulás és az irányvektorok ezeket megsokszorozhatják. A modern stadionokban ezt optikai kamerák (jellemzően 8-16 kamera egyszerre) vagy rádiófrekvenciás jeladók (GPS/UWB chipek a játékosok felszerelésében) biztosítják.

A három meghatározó adatszolgáltató eltérő megközelítést képvisel. Az Opta (ma a STATS Perform leányvállalata) az egyik legelterjedtebb szereplő: adatai a Premier League, Bundesliga, La Liga és Serie A mérkőzéseire is elérhetők. A legtöbb fogadóiroda ezeket a háttéradatokat használja az odds-modelljeihez. A StatsBomb forradalmasította a nyílt hozzáférésű futballstatisztikát: nem csupán a labda és az aktuális játékos pozícióját rögzítik egy adott eseménynél, hanem az összes többi játékos koordinátáját is pillanatfelvételszerűen.

Ez lehetővé teszi például annak pontos elemzését, hogy egy indítás pillanatában hány védő állt les-pozíción kívül. A Wyscout elsősorban az edzők és játékos-megfigyelők eszközeként indult, ám mára komplex pozíciós adatokat is kínál, különösen az alacsonyabb ligák szintjén. Ez azért érdekes a fogadók számára, mert kisebb bajnokságokban kevésbé fejlett modelleket alkalmaznak, így az ilyen adatokhoz való hozzáférés relatív előnyt (edge-et) biztosíthat.

Miért változtatja meg az elemzés logikáját a térbeli adat?

A hagyományos sportelemzés korábban eseményalapú volt: kapura lövések száma, passz-pontosság, szerzett labdák. Ezek az adatok hasznosak, de egydimenziósan írják le a játékot, nem mondják el, hogy hogyan született egy esemény, és mi volt körülötte a térbeli kontextus. A tracking data ezt alapvetően változtatta meg. Vegyünk egy konkrét példát: két csapat egyaránt 15 kapura lövést produkál egy mérkőzésen. Az eseményalapú adat alapján ezt egyforma teljesítménynek látjuk. A StatsBomb 360 adatai viszont megmutathatják, hogy az egyik csapat lövései zömmel szűk szögből, sűrű védősorral megterhelve születtek. A másik csapat a lövései nagy részét viszont teljesen szabad helyzetből, a büntetőterületen belülről adta le. Ez drámaian eltérő várható gól értéket (xG) eredményez. Pontosan ez az az információ, amelyet a fogadási modellekbe érdemes integrálni.

A modern taktikai elemzés egyik kulcsfogalma a pitch control, azaz a pálya dominancia. A tracking data lehetővé teszi, hogy pillanatról pillanatra megmérjük, a pálya melyik részét „uralja” adott csapat. Így meghatározható, hogy egy adott koordinátapontot melyik csapat játékosa ér el hamarabb, figyelembe véve a sebességet, az irányt és a távolságot. Ez az elemzési keret teljesen más megvilágításba helyez olyan mérkőzéseket, ahol az egyik csapat labdabirtoklás szempontjából alulmarad, de strukturálisan erős nyomást fejt ki. Az ilyen csapatok hagyományos statisztikákkal rendre alulbecsültek a fogadási piacokon.

Az xG (expected goals) ma már szinte általánosan ismert fogalom, de ez is fejlődött. A post-shot xG modellek már nem csupán a lövés helyzetéből becsülik a gólvalószínűséget, hanem a labda pontos becsapódási szögét és a kapus koordinátáit is figyelembe veszik. Ez kizárólag tracking adatokkal lehetséges, és fogadási szempontból nem elhanyagolható. Egy csapat klasszikus xG-je és a post-shot xG-je közötti tartós eltérés value bet lehetőséget nyithat meg.

Mely fogadási piacokra alkalmazható közvetlenül?

Gólszám-piacok: az over/under piac az egyik legközvetlenebb alkalmazási terület. A tracking data alapú xG-modellek pontosabbak, mint a közkeletű lövésszám-alapú modellek – különösen ha post-shot komponenst is tartalmaznak. Az a csapat, amelyik tartósan kontrollál magas értékű tereket, nem feltétlenül lő sokat, de a gólveszélye strukturálisan magasabb. Ezt csak pozíciós adatokkal lehet megbízhatóan mérni.

Mérkőzés-kimeneteli piacok: a fogadók jelentős része Poisson-eloszlásra épülő modelleket alkalmaz. A tracking data ennél sokkal mélyebb bepillantást nyújt a csapatok valódi erejébe. A PPDA (az ellenfél egy kapura vezető akciója előtt leadott passzok száma a védekezési harmadban) pressing-intenzitás mutatója segítségével azonosíthatók azok a csapatok, amelyek rövid távon alulmúlják az elvárásokat, miközben a strukturális teljesítményük nem indokolja. Ez pontosan az a regressziós helyzet, amelyre a value betting épül.

Szöglet-piacok: sokszor alacsonyabb figyelmet kapnak, ami piaci lehetőséget teremt. A tracking adatok kimutatták, hogy a sarokrúgások száma erősen korrelál a pályaellenőrzéssel és a magas értékű területekre leadott passzok számával, nem csupán a lövésmennyiséggel. Azok a csapatok, amelyek strukturálisan az ellenfél veszélyes zónáit uralják, szignifikánsan több szögletet termelnek. Akkor is, ha az eredmény vagy a lövésszám ezt nem tükrözi.

Játékos-specifikus piacok: a pozíciós adatok alapján meghatározható, hogy egy adott játékosnak mérkőzésről mérkőzésre milyen minőségű helyzetei vannak (xGOT). Különösen érdekes az xA (expected assists). A StatsBomb adatai alapján mérhető, hogy egy adott passz pillanatában milyen volt a befogadó játékos elé táruló tér minősége. A tartósan magas xA-val rendelkező, de alacsony asszisztszámot produkáló játékos statisztikailag alulértékelt az assziszt-piacokon.

Lapok és in-play piacok: a pressing-intenzitás mérések kimutatják, hogy a szisztematikusan magas fizikai nyomással játszó csapatok szignifikánsan több sárga lapot produkálnak. Ez a bukmékereknél nem mindig épül be pontosan az árstruktúrába. Az in-play fogadásoknál a momentum-alapú modellek (amelyek az utolsó 15 percben mutatott pályaellenőrzési fölényt mérik) szignifikáns előjelzési erővel bírnak a mérkőzés hátralévő részére.

Az adatokhoz való hozzáférés

A nyers tracking data licencdíjai nagyon drágák. Elsősorban professzionális kluboknak, fogadóirodáknak és intézményi befektetőknek érhetők el kereskedelmi alapon. Ugyanakkor közvetett hozzáférési utak is léteznek. A StatsBomb Open Data projekt GitHub-on nyilvánosan elérhetővé tett több száz mérkőzés teljes adatát. Ezek archív anyagok, de modellépítésre kiválóan alkalmasak. Az FBref.com platform számos tracking-alapú mutatót nyíltan közöl (xG, xA, progressive passes, SCA). A Wyscout kisebb ligákra is kiterjedő adatbázisa részben elérhető kedvező feltételekkel. A professzionális fogadók számára a reális stratégia ezek kombinálása saját modellépítéssel.

A modern prediktív fogadási modellek ma már mélytanulási architektúrákat alkalmaznak – rekurrens neurális hálókat az időbeli szekvenciák feldolgozásához és gráfhálókat a játékosok közötti térbeli relációk leírásához. Az ilyen modellek kimenete valószínűségi eloszlásokká fordítható le. Ez a fejlődési irány azt jelzi, hogy az adatalapú sportfogadás a következő években tovább növeli a különbséget az informált és az informálatlan fogadók között. Aki megtanulja értelmezni és alkalmazni ezeket a metrikákat, tartós versenyelőnyre tehet szert a piacon.

A www.tippmix.info weboldal és a hozzá tartozó közösségi terek azoknak az adatalapú sportfogadóknak szólnak, akik a tracking data és a térbeli adatok segítségével kívánnak mélyebb rálátást szerezni a fogadási piacokra.