WAT ALS….STATISTIEK DE UITSLAG BEPAALT?

“We verdienden meer.” Een zin die coaches en bestuurders graag in de mond nemen. Voor bestuurders is het zelfs een argument om een ontslag te verantwoorden – sorry, Glen De Boeck. Maar verdiende jouw ploeg echt meer punten? Is er een betere manier dan het klassement om de sportieve prestaties naar waarde te schatten? Samen met de blogsite ”Onder De Muur” zochten we het uit.

De paal of de lat.

Een – al dan niet bewuste – scheidsrechterlijke dwaling of een doelman in bloedvorm.

Voetbal is geen spel van zekerheden. Toeval en chaos zijn de leukste en tegelijk ook meest vervelende ingrediënten van de sport. De ingrediënten die ook jouw plaats in het klassement mee bepalen.

Als voetbalbestuurder is het dus zaak om daar – tot op zekere hoogte – voorbij te kunnen kijken. Om een inschatting te kunnen maken van de eigenlijke prestaties.

Los van het resultaat.

Nederlands voetbaljournalist Sam Planting bijvoorbeeld legt vaak de nadruk op hoe je het resultaat van een wedstrijd moet kunnen loskoppelen van het proces van een team op lange termijn.

Het huidige klassement biedt misschien te weinig houvast om de aandacht op dat proces te houden en kan je in de richting duwen van kortzichtige analyses of overhaaste ontslagrondes.

Het klassement in de Jupiler Pro League na de heenronde.

Op zoek dus naar alternatieven.

VERWACHTING

Laten we bij het begin beginnen: de uitslag van één wedstrijd. Een niet-gefloten penalty, een ongelukkige owngoal,…. Door toevalligheden kan de uitslag van een enkele wedstrijd makkelijk verstoord raken.

Zijn er dan mogelijkheden om dat toeval wat uit te filteren?

Een van de mogelijkheden is gebruikmaken van de statistiek “Expected Goals” (xG) (/link). Deze statistiek brengt de kwaliteit van de gecreëerde kansen van elk team in kaart en zorgt zo voor een alternatieve, statistisch verwachte uitslag van de wedstrijd.

Deze statistiek is zeker niet feilloos. Net als alle data en statistieken, moet ook deze in zijn context bekeken worden. En het belangrijkste deel van deze context is de tussenstand. In het jargon, “Game State”.

De tussenstand in een wedstrijd heeft een invloed op het gedrag van de teams. Teams die op voorsprong staan, zakken al eens in en teams die achtervolgen, gaan nadrukkelijker op zoek naar een doelpunt.

Dit zal gevolgen hebben voor de uiteindelijke “Expected Goals”.

Ondanks de gebreken kan het toch nuttig zijn om deze statistiek te raadplegen. Onderzoek toont namelijk aan dat deze statistiek een betere manier is om de toekomstige resultaten van een team in te schatten en zo dus een betere weerspiegeling kan zijn van de “echte” kwaliteit van een team dan de “werkelijke” uitslag.

LOKERSE PROBLEMEN

Grote uitspraken doen over de toekomst op basis van de – al dan niet gecorrigeerde – uitslag van één wedstrijd is natuurlijk niet verstandig.

Zo is de ploeg die, tijdens de afgelopen heenronde, het hoogste aantal Expected Goals wist te creëren binnen één wedstrijd verrassend genoeg “degradatiekandidaat nummer één”: Moeskroen. In de thuiswedstrijd tegen Gent verzamelden ze meer dan 5 xG. Aan de andere kant van het spectrum bleef KV Kortrijk aan het begin van het seizoen dan weer op bijna 0 xG hangen tegen Antwerp – kansloos.

De xG-creatie over één wedstrijd zegt ons dus niet veel over de algemene sterkte van een team. Maar wat nu als we voor elke ploeg bekijken hoeveel “Expected Goals” ze creëerden in elke match van de heenronde?

Het resultaat is een statische weergave die ons een beter zicht heeft op de xG van elke ploeg over de eerste vijftien wedstrijden van het seizoen. Naast de mediaan, is ook de spreiding van de xG-creatie over de vijftien wedstrijden zichtbaar. De problematische Lokerse resultaten vallen daarbij op.

Bij Lokeren observeren we gemiddeld de laagste xG-waarden. Vooral het gebrek aan spreiding daarbij is alarmerend. De ploeg van Roger Lambrecht slaagt er dus systematisch niet in om kwalitatieve kansen bij elkaar te spelen. Zo wordt het moeilijk om een doelpunt te maken, wat noodzakelijk blijft om een voetbalwedstrijd te winnen.

Deze grafiek zet de zelf gecreëerde xG (zwarte lijn) af tegen de xG-creatie van de tegenstander (lichtroze lijn) voor elke wedstrijd van Lokeren dit seizoen.

Als we de situatie van Lokeren gedetailleerder analyseren, is er aanleiding voor grotere alarmsignalen. In elke wedstrijd dit seizoen creëerde Lokeren namelijk minder Expected Goals dan de tegenstander. Dus ook, bijvoorbeeld, bij de 2-0 winst tegen Eupen wist Lokeren weinig tot geen goede kansen af te dwingen.

Extra pijnlijk: Lokeren is de enige ploeg waarbij deze trend zichtbaar is.

ALTERNATIEF

Nu we de “Expected Goals” van elke ploeg en elke wedstrijd kennen, kunnen we een stap verder gaan: een alternatief, statistisch klassement opstellen. Maar hoe?

Op basis van de xG die een team tijdens een wedstrijd heeft gecreëerd, simuleert “Kick&RushLab” (/link) de kans dat dat team 0,1,2 of meer doelpunten had kunnen maken in die wedstrijd. Als je dit voor de beide teams doet, bekom je de kans dat een bepaalde uitslag in die wedstrijd zich had kunnen voordoen.

Deze kansen worden hieronder – als voorbeeld – voor de wedstrijd Genk-Charleroi uitgewerkt:

Deze tabel brengt de procentuele kans op elke mogelijke uitslag van een wedstrijd in kaart. Op basis van de xG van beide ploegen, was de kans dat Genk – Charleroi op 3-1 had kunnen eindigen dus 9%.

Daarna, kunnen dan alle uitslagen waarbij Genk meer had kunnen scoren dan Charleroi worden samengeteld tot de winstkans van Genk in die wedstrijd, op basis van de gecreëerde xG. De winstkans wordt vermenigvuldigd met 3 en de kans op een gelijkspel met 1 en zo bereken je de “Expected Points” (xPoints) van Genk in die wedstrijd.

Als je deze berekening voor elk team en elke wedstrijd doet, bekom je het “xPoints-klassement”. Deze statistische rangschikking ziet er voor de Jupiler Pro League, na vijftien speeldagen, als volgt uit:

In dit alternatieve klassement, waarin gelijke spelen wat worden overschat, wordt de benarde Lokerse situatie extra geaccentueerd. Een afgetekende laatste plaats is het verdict.

Deze rangschikking geeft ons een houvast om te kunnen stellen dat Waasland-Beveren en Lokeren niet door tegenslag onderin verzeild zijn geraakt. Structurele problemen liggen waarschijnlijk aan de grondslag, fundamentele kopzorgen zijn het logische gevolg.

Het xPoints-klassement helpt ons om door het – door toeval benevelde – “echte” klassement heen te kijken. Om de prestaties en het “echte” puntenaantal te onderbouwen en context mee te geven. En de “nieuwe” ranking leidt natuurlijk ook tot extra vragen.

Had Glen De Boeck met 20 punten op zak ook het Guldensporenstadion moeten verlaten?

BRUGGE-UIT, ALTIJD LASTIG

Opnieuw. Dit alternatief is geen heilige graal. Geen onfeilbaar instrument. Dit statistisch klassement kan jouw oordeel over een team wat bijschaven en beter onderbouwen, maar heeft ook zelf nog wat bijvijlwerk nodig.

Zo houdt deze rangschikking geen rekening met de moeilijkheidsgraad van het programma dat elk team al voorgeschoteld kreeg. Bijvijlen dus.

Om de moeilijkheidsgraad van een programma vast te leggen, moeten we natuurlijk op een meer objectieve manier de sterkte van alle zestien teams kunnen nagaan. Hiervoor maken we gebruik van de zogenaamde “Elo-rating” (/link).

De “Elo-rating” kan de sterkte van een ploeg op een meer betrouwbare manier in kaart brengen en wordt elke speeldag bijgewerkt. Deze rating houdt wel rekening met het afgewerkte programma. De prestaties tegen sterke en zwakke tegenstanders worden op een andere manier meegenomen in de berekening ervan.

In deze grafiek wordt, volgens de huidige rangschikking, de “ELO-rating” van elke ploeg opgelijst. Club Brugge is de sterkst ingeschatte ploeg, Moeskroen de zwakst ingeschatte.

Deze ratings leveren voor België geen verrassend beeld op. Genk, Club en Anderlecht zijn dit seizoen de sterkste teams. Lokeren, Moeskroen en Eupen bengelen onderin.

Dus kunnen we nu nagaan welke clubs al tegen de sterkere teams – met een hoge “ELO-rating” – op verplaatsing speelden en welke clubs de topteams voornamelijk thuis mochten ontvangen. Dit zal ons opnieuw een indicatie geven van de moeilijkheidsgraad van hun programma de afgelopen heenronde.

Deze grafiek is een indicatie van de moeilijkheid van het al afgewerkte programma op basis van de “Elo-rating” van de tegenstanders. Hoe hoger (“blauwer”) de waarde voor een team, hoe meer dat team het thuis moest opnemen tegen sterk ingeschatte tegenstanders en zwak ingeschatte tegenstanders op verplaatsing moest bekampen. De lagere (“rodere”) waarden vertellen natuurlijk het omgekeerde verhaal.

Deze analyse is weer een extra laag context die we over de klassementen kunnen leggen. Zo moest Lokeren in de heenronde vooral op bezoek bij de sterkere tegenstanders en kon Moeskroen heel wat van die topteams thuis al het vuur aan de schenen leggen.

Van de Grote-5 speelde Standard zijn topwedstrijden in de heenronde vooral in eigen huis – zoals op onderstaande afbeelding te zien is. Club Brugge bevindt zich in de tegengestelde situatie.

GLAZEN BAL

Van de verwachte punten op basis van de afgelopen vijftien wedstrijden konden we al een inschatting maken. Maar kunnen we ook verder kijken? Hoe zal het klassement eruit zien in maart, als de reguliere competitie is afgelopen?

Is de toekomst te voorspellen?

Een Amerikaanse media-autoriteit in het voorspellen van de toekomst, namelijk verkiezingsuitslagen, is “FiveThirtyEight”. Door het bundelen van alle Amerikaanse peilingen in een statistisch model proberen ze een accurate voorspelling te maken van de verkiezingsuitslag.

Dat doen ze ook voor voetbal. De mogelijke eindstand is de verkiezingsuitslag. Iedere speeldag vormt een nieuwe peiling.

Door middel van statistische berekeningen en modellen, die ook hun oorsprong vinden in Expected Goals, proberen ze de eindstand te voorspellen.

Ook de Belgische competitie wordt iedere wedstrijd opnieuw door het model gehaald. Het eindklassement wordt iedere week nauwkeuriger voorspeld.

Volgens “FiveThirtyEight”, begint Genk met een kans van 45% als koploper aan de play-offs. Moeskroen zien we met een kans van 35% volgend jaar aan het werk in 1B.

Als de voorspellingen uitkomen natuurlijk. Want in de toekomst kijken is leuk. Ze bouwt namelijk verder op de trends die nu al vast te stellen zijn.

Maar in het voetbal is er ook nog altijd de paal.

En de lat.

—-

Benieuwd naar meer werk van Kick&Rushlab? Volg ons op Twitter, Facebook of volg deze blog. We staan open voor samenwerking!
Vergeet ook niet de blog van Onder De Muur aan je favorieten toe te voegen! En volg hen op twitter!

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s