Achtergrond
Zij wonnen (ook) door big data
Tijdens het EK maakten Leidse informatici een data-analyse van de Oranje Leeuwinnen en hun tegenstanders. ‘Maar wij gaan natuurlijk niet uitleggen wat er beter moet.’ Over een kast in het kantoor van Joost Kok, hoogleraar fundamentele informatica, hangt een oranje supportersjaal. Het is een herinnering aan een bijzonder project dat Leidse wetenschappers en studenten afgelopen zomer samen met de KNVB en de overheidsdenktank Topteam Sport uitvoerden tijdens het EK voor vrouwen in Nederland.
Vincent Bongers
donderdag 18 januari 2018
In de EK-finale Nederland-Denemarken springt Lieke Martens in de armen van Vivianne Miedema die net de beslissende 4-2 heeft gemaakt. © Pim Ras/Hollandse Hoogte

‘Het is bijzonder dat zo’n kampioenschap hier plaatsvindt; het bood een uitstekende kans voor onderzoek’, zegt Kok. ‘We hebben een uitgebreide data-analyse gemaakt van alle zestien deelnemende teams en gegevens verzameld van alle 31 wedstrijden. Vervolgens gingen we op zoek naar de gouden standaard: waarin verschillen de kampioenen van de andere ploegen?’

Extra aandacht hadden de onderzoekers voor het spel van de Oranje Leeuwinnen, die kampioen werden door in de finale Denemarken met 4-2 te kloppen. ‘Dat hadden we niet verwacht’, aldus Kok. Hij beleefde de overwinning anders dan de meeste Nederlandse toeschouwers. ‘Ik moest data verzamelen, dan zit je tijdens de finale toch meer in werkmodus: gaat alles wel goed?’

Dure onderneming

‘Ik heb de overwinning ook niet uitbundig gevierd’, zegt postdoc Arie-Willem de Leeuw, die net als Kok is verbonden aan het Leiden Institute of Advanced Computer Science. ‘Maar ik ben wel liefhebber, en zou het toernooi toch wel gevolgd hebben.’

‘Ik vind het heel gaaf dat ze kampioen zijn geworden’, zegt informaticastudent Patrick Bergman (27). In de voorbereidende fase schreef hij de software die de analyse verricht. ‘Uiteindelijk krijg je dan statistieken te zien, bijvoorbeeld het aantal succesvolle passes – of het balverlies – van team A en team B in een helft. Dat kun je dan ook per speelster zien.’

Alleen: het op de voet volgen van de voetbalsters was niet eenvoudig, zegt Kok. ‘Je wilt heel precies weten waar spelers en bal op elke moment zijn. Maar van de Europese voetbalbond UEFA mag je bijvoorbeeld geen chip in de schoen van een speelster doen. Alles moet dus op afstand gebeuren. Dus je hebt speciale camera’s nodig en mensen die ze bedienen, dat kunnen we zelf niet. Dat maakt het een dure onderneming.’

De Leeuw: ‘Je hebt twee soorten gegevens. Zogeheten eventdata hebben alles met de bal te maken, bijvoorbeeld een schot op doel of een voorzet. Positionele data geven aan waar speelsters zich op het veld bevinden en hoe teamgenoten en tegenstanders zich tot elkaar verhouden.’

Afgesproken tactiek

Op zijn computer laat Kok elf rode en elf blauwe stippen zien op een voetbalveld. ‘Als ik op een van de stippen klik, dan verschijnt er een getal.’ De Leeuw: ‘Bij elke opstelling kun je berekenen hoe groot de kans is dat een team binnen tien seconden met de bal in het strafschopgebied van de tegenstander komt. Daar verwijst het getal op het scherm naar.’

Kok: ‘Niet alle speelsters zijn even snel, dus iemand vervangen door een snellere wissel heeft ook invloed. Je kunt ook geheel objectief laten zien of iedereen zich aan de afgesproken tactiek heeft gehouden.’

Hij klikt op een rode speelster aan de linkerkant van het veld en schuift haar wat meer naar voren. Het getal verandert: de kans op een gevaarlijke situatie bij het doel van de tegenstander wordt groter. ‘We kunnen ook een heatmap maken zodat je ziet waar op het veld welk team het overwicht heeft. Dan visualiseer je waar een elftal het verschil maakt.’

Al tijdens het EK informeerden de data-analisten de trainers van Oranje. ‘Dan gaf de staf aan wat ze wilden zien, en rekenden we dat uit’, aldus Kok. ‘Hoeveel meter legt iemand af? Hoeveel balcontacten heeft een speelster? En heel belangrijk: hoe ontwikkelt zich dat dan gedurende de wedstrijd? Je maakt een tijdlijn. Maar het is natuurlijk niet zo dat wij gingen uitleggen wat er beter zou kunnen. Zij zijn al jaren bezig met het bouwen van een team. Zo’n proces moet je ook niet verstoren.’

Maar kun je bijvoorbeeld zeggen dat Oranjespits Vivianne Miedema het beste op de rand van het strafschop in stelling kan worden gebracht?

De Leeuw: ‘Dat is wel heel erg specifiek. Je kunt wel succesvolle patronen herkennen. Als speelster ‘A’ naar speelster ‘B’ passt en die vervolgens een voorzet geeft naar ‘C’ is de kans op een doelpunt tien procent. Een “eventstroom” noemen we dat.’

Als het gaat om het tonen van gegevens die betrekking hebben op de prestaties van de specifieke Leeuwinnen op het EK zijn de onderzoekers heel voorzichtig.

Geen info delen

‘Ik weet niet precies wat we mogen laten zien’, zegt De Leeuw. ‘Dat maakt het lastig.’ Bergman: ‘Wij kregen de resultaten van de analyse ook niet te zien. Op zich logisch, dat beperkt de kans op lekken.’ Kok: ‘Data maken zaken enorm inzichtelijk, je wilt niet je geheimen delen met de tegenstander, dat is altijd zo bij topsport. De Nederlandse schaatsers zijn ook altijd bezig met snellere pakken en dergelijke. Die info ga je niet delen met de Koreanen. Maar dat is niet de enige afweging. Het gaat ook om privacygevoelige informatie over speelsters. Die hebben grote belangen, bijvoorbeeld hun transferwaarde. Deze data zouden daar invloed op kunnen hebben.’

Maar voetballers kunnen ook juist gebruik van maken van de analyses. ‘Oranje-international Memphis Depay mislukte bij Manchester United en moest op zoek naar een andere club,’ zegt Kok. ‘Hij gaf het voetbaldatabedrijf SciSports in Amersfoort de opdracht om uit te zoeken welk team het beste bij zijn speelstijl paste. Mede op basis van hun advies koos hij voor Olympique Lyon. In Nederland is de sportdata-industrie heel groot. Een bedrijf als Gracenote Infostrada verzamelt overal ter wereld informatie over sportwedstrijden en verkoopt die aan allerlei klanten, waaronder het IOC.’

Ook op televisie zie je steeds meer data, zegt Kok. ‘In de Spaanse competitie zijn heatmaps van spelers te zien. Bij wielerwedstrijden krijgt de kijker de hartslag van renners te zien. Het is slechts het topje van de ijsberg. We hebben hier het Sport Data Center waarin Leiden samenwerkt met het Amsterdam Institute for Sport Science en de TU Delft. We trekken het gebruik van data-analyse veel breder dan alleen topsport. Via een app volgen we bijvoorbeeld miljoenen hardlopers. Die database kun je gebruiken om de kans op blessures in te schatten. Maar er zijn ook allerlei toepassingen buiten de sport. Een gamechanger zou een persoonlijk bewegingsadvies voor elke Nederlander zijn. Een TomTom om te bewegen, als het ware. Het gaat om veel meer dan alleen voetbal.’

.

KNVB: ‘Alle beetjes helpen’

‘Uit het Leidse onderzoek blijkt dat Oranje op heel veel fronten was beter dan de andere landen’, zegt Peter Blangé. De oud-volleyballer en Olympisch Kampioen is tegenwoordig prestatie- en innovatiemanager bij de KNVB. 

‘Nederland was bijvoorbeeld heel efficiënt wat betreft doelpogingen. Er waren weinig kansen nodig om te scoren. We zijn er in geslaagd om uit die positiedata van wedstrijden van Nederland allerlei interessante informatie te halen. Hoe was de druk op de bal op een bepaald moment in de wedstrijd. Wie staat waar tijdens een aanval van een tegenstander? Wie is er allemaal aanspeelbaar als de bal in bezit is van Oranje?’

De Oranje Leeuwinnen, die zaterdag een oefenduel spelen tegen Spanje, moeten zich nog plaatsen voor het WK in Frankrijk in 2019. Gaan de Leidse wetenschappers daar straks ook onderzoek doen? ‘Het LIACS heeft veel interessante bevindingen gedaan. We gaan nu kijken hoe we data-analyse in de toekomst verder vorm gaan geven. De intentie is wel om nog een stap verder te gaan. Daar kan Leiden ook een rol in spelen. We staan pas aan het begin van een echte data-run in het voetbal.’

Is de titel daar ook al aan te danken? ‘Het gaat echt te ver dat Nederland Europees kampioen is geworden door data-analyse. Ik geloof wel dat alle kleine beetjes helpen.’