auteur
Julien Assunção et @OMalytics

Du même auteur

> article précédent

Improbable dernière minute

Opta Forum 2017, une fenêtre sur le futur des statistiques ?

Le grand rendez-vous annuel de la data a ouvert quelques portes sur ce que pourrait être l'avenir d'outils d'analyses du football. Avec ce que cela comprend d'imperfections comme de promesses... Analyse détaillée.

Partager

 

Le 8 février 2017 a eu lieu à Londres le dernier "OptaPro Analytics Forum". C’est la quatrième itération de ce rassemblement d’analystes (plus ou moins) amateurs et de professionnels du sport autour de conférences sur la statistique dans le football. Comme son nom l’indique, cet événement est organisé par la société Opta, principal fournisseur de données statistiques.

 

La participation étant ouverte à tous, soixante-dix propositions de présentations ont été évalués par un panel de juges, qui en ont sélectionné onze. Il faut aussi ajouter celle de Dennis Lock, "Director of Analytics" aux Miami Dolphins (franchise de NFL). Voici les différentes tendances qui ressortent repérées lors de cet OptaPro Forum 2017.

 

 

L’arrivée des données de tracking

Grâce au partenariat avec TRACAB, Opta mettait pour la première fois à disposition des participants des "tracking data": des données détaillées qui suivent la position des vingt-deux acteurs et du ballon. Martin Eastwood a choisi de mettre à profit ces informations pour évaluer la prise de décision d’un joueur aux abords de la surface à partir de la position du porteur de balle, de ses partenaires et des adversaires. Probablement la première fois qu’un modèle combine Expected Goals et position des joueurs.

 

 

 

 

William Spearman s’en sert lui pour évaluer la probabilité de réussite d’une passe. Les données de TRACAB servent ici à définir les paramètres initiaux de la passe: emplacement/vitesse de la balle et des joueurs. Cela permet de mesurer les qualités de passeur d’un joueur de manière bien plus efficace que les modèles actuels en étudiant le pressing adverse mais aussi en isolant les qualités de contrôle de la cible, facteur que ne maîtrise pas le passeur.

 

À l’heure où placer "Big Data" un peu partout semble être tendance, le terme s’applique bien ici. Avec 3,51 millions de valeurs mesurées par match, on touche aussi la limite de ces mesures. Tout est démultiplié, la puissance de calcul mais aussi le nombre d’analystes nécessaires pour profiter de ce foisonnement de données. Difficile donc de s’en servir en cours de match.

 

On imagine toutefois assez vite l’impact que peut avoir leur utilisation, notamment sur tout l’aspect défensif, où le principal se passe sans le ballon. La prise en compte des défenseurs dans un modèle d’Expected Goals par exemple, mais aussi connaître la distance moyenne entre un défenseur et son vis-à-vis. Le champ des possibles est tellement important qu’il faudra savoir sélectionner les informations pertinentes. Impossible également d’imaginer les blogeurs amateurs avoir accès à ce type de données. Une révolution qui devrait donc se faire dans l’ombre?

 

 

Les Expected Goals comme outils

En parlant d’Expected Goals, ceux-ci ne sont plus utilisés comme une fin en soi mais comme un outil de mesure. C’était le cas dans la présentation de Martin Eastwood, où l’auteur considère qu’une bonne décision est une action qui maximise la valeur de l’Expected Goal. Par leur caractère plus objectif et prédictif, ils peuvent donc remplacer les buts pour estimer la réussite d’une stratégie. Ils sont également de plus en plus utilisés en association avec un autre modèle statistique.

 

On ressent cette évolution dans la conférence de Neil Charles sur la manière d’optimiser les zones de tirs, où ils sont combinés à un modèle estimant la difficulté d’une passe. Le but étant de définir la frontière où tirer devient une meilleure option que la passe vers un coéquipier.

 

"Probabilité de marquer des différentes options de Ross Barkley"


 

Les Expected Goals sont un outil de diagnostic puissant mais limité tactiquement. Une fois que l’on connait les zones préférentielles de tirs, on a besoin de savoir comment y accéder. Une démarche que l’on retrouve dans la présentation de Garry Gelade sur l’art de centrer, lequel explore les types de centres les plus efficaces. Alors que cette statistique fait son entrée dans les médias grand public (BBC, Canal+, etc.), elle a déjà été plus ou moins digérée par les analystes, qui passent désormais à l’étape suivante.

 

 

Des tirs aux passes

L'intérêt des analystes s'est en effet d'abord concentré sur les tirs, pour l'importance qu'ils ont quant au résultat final mais aussi car les données sont plus accessibles et relativement simples à manipuler. Pour autant, ce sont bien les passes qui constituent le cœur du football et l'action la plus courante exécutée par un joueur. D'où l'investissement progressif de ce secteur du jeu.

 

 

"Évolution des différents types d’attaque en proportion des tirs (PL saisons 12/13 à 16/17)"

 
 

L'étude des passes a de plus l'avantage de se rapprocher des préoccupations tactiques des entraîneurs, et donne lieu à une variété d'approches que les tirs n'offraient pas:

 

• Une approche stylistique ou qualitative comme celle de Will Gürpinar-Morgan qui montre comment identifier et analyser les stratégies d’équipe, ou celle de Bobby Gardiner et Joel Becker relative aux entraîneurs et leur style de jeu, qui se servent également des passes pour créer un certain nombre de métriques qualitatives.

 

• Une approche quantitative comme celle de William Spearman qui utilise les données de tracking pour aller au-delà du simple pourcentage de passes réussies et évaluer les passes de manière holistique.

 

• Une approche hybride par David Perdomo Meza qui identifie des tendances au niveau collectif uniquement sur la base des joueurs qui composent les séquences de passes et qui en déduit ensuite une évaluation individuelle.

 

On le voit, l'attention portée aux passes est pleine de promesses et représente également une opportunité unique d'appliquer un éventail d'outils mathématiques qui vont de la topologie aux algorithmes d'intelligence artificielle.

 

 

 

De nouveaux outils statistiques

Les articles de la communauté "Football Analytics" s'appuient sur un éventail d'outils statistiques de plus en plus large et le forum 2017 nous en a donné une belle illustration. Bien qu'elles ne soient pas nécessairement nouvelles, l'utilisation publique de ces techniques appliquées au football est en revanche relativement récente.

 

Martin Eastwood a navigué entre différentes méthodes pour son application: "réseaux neuronal", "machines à vecteurs de support", avant d’opter pour une régression logistique plus classique. Neil Charles a lui utilisé un algorithme dit "forêt d’arbres décisionnels" pour créer son modèle d’Expected Passes.

 

 

"Forêt d’arbres décisionnels"

 
 

Ces méthodes complexes à appréhender mais relativement simples à implémenter donnent bien souvent des résultats plus précis (au prix parfois d’un besoin calculatoire plus important) mais pèchent par l’interprétabilité de leurs résultats.

 

On touche ici à notre avis à la principale barrière à l'entrée des statistiques dans le football: pour être adoptés par les principaux acteurs du secteur sportif d’un club, il faut que les résultats soient compréhensibles et assimilables par des non-initiés. Les analystes ont de leur côté un travail à faire pour présenter le résultat de leur travail avec pédagogie et honnêteté.

 

Via la présentation de Constantinos Chappas sur l’incertitude des métriques, on voit comment peut (doit?) être présenté le travail d’un analyste: en montrant de manière explicite les données utilisées, les calculs et surtout le niveau de confort quant aux résultats des travaux.

 

 

 

 

Pour cela, l’approche dite bayésienne et les intervalles crédibles qu'elle permet de calculer sont à la fois relativement transparents et simples à appréhender. Plutôt qu’un intervalle de confiance, souvent mal interprété, l’intervalle crédible nous donne le pourcentage de chance qu’un paramètre soit compris entre deux valeurs. Les modèles ont par nature un niveau inhérent d'incertitude et il convient d'en informer les utilisateurs.

 

Le chemin est donc étroit pour les statistiques dans le football, qui doivent naviguer entre de multiples écueils: la complexité des méthodes, la difficulté d'interprétation des résultats, la sur-simplification mais aussi faire face aux réticences d'un sport dont la plupart des acteurs doivent encore être convaincus de leur pertinence.

 

 

De l’importance du style de jeu

Une autre tendance de ces derniers mois et que l’on retrouve sur cet OptaPro Forum est l’emphase mise sur la manière plutôt que le résultat.

 

Il est évidemment intéressant de savoir quelles équipes/joueurs sont les plus performants, mais savoir analyser le style de jeu utilisé a de nombreux avantages. Il permet, par exemple, de se préparer à un type d’attaque en particulier ou exploiter une faiblesse de l’adversaire. Cela importe également dans la phase de recrutement, où il ne suffit pas de prendre un bon joueur/entraîneur pour que son arrivée soit une réussite. D’autant plus que la plupart des statistiques sont d'ordre stylistique, donc grandement influencées par l’équipe dans laquelle un joueur évolue.

 

 

Côté joueurs, David Perdomo Meza aborde le sujet en utilisant les séquences de passes et Will Gürpinar-Morgan en s’intéressant aux différents types d’attaque selon la façon dont sont menées les phases de possession. Dans ces deux présentations, Leicester City est un cas d’école, une équipe systématiquement à part.

 

Bobby Gardiner et Joel Becker se sont, eux, posés une question: le style de jeu dépend-il des entraîneurs? Cela peut sembler évident mais c’est important de le chiffrer, notamment pour éviter des nominations parfois vouées à l’échec. Dans un sport qui brasse autant d’argent, les présidents de club doivent le moins possible laisser la place au hasard.

 

 

Conclusion

Le forum Opta est un des rares lieux (après Twitter) où les analystes amateurs peuvent présenter leur travail aux acteurs du monde professionnel. Ces amateurs sont de plus en plus nombreux sur internet mais, paradoxalement, les travaux novateurs semblent se tarir. Les "fanalysts" oscillent en effet entre peur de voir leurs productions récupérées directement par les clubs et besoin de se faire connaître.

 

Un intérêt des clubs qui se matérialise par les cinquante équipes représentées au forum, que ce soit au niveau de l’équipe première ou du centre de formation. Avec de l’avance pour les équipes anglaises et allemandes, le Paris Saint-Germain étant le seul représentant français. Pour autant, les passerelles fonctionnent-elles réellement? On compte actuellement sur les doigts d’une main les amateurs passés pros au sein de clubs. Est-ce une question d’offre (les clubs n’ouvrent pas de recrutements sur ce type de poste), de demande (les profils disponibles ne correspondent pas aux besoins) ou de canal de recrutement (les clubs piochent en dehors de la communauté)?

 

L’exemple des sports américains tend à nous faire pencher vers la première option: la valeur des statistiques est reconnue au sein des clubs mais la création d’équipes de statisticiens / data scientists en interne met du temps à se mettre en place ou se fait en interne via l’utilisation de staff déjà présent (analystes vidéo en particulier). Reste à savoir si c'est le meilleur moyen de tirer parti de toutes ces données.

 

Aussi étonnant que cela puisse paraître, c’est l’argument financier qui est souvent avancé par les clubs refusant d’investir dans ce domaine. La mise en place d’un service dédié à l’analyse statistique et l’obtention des données nécessaires a effectivement un coût mais celui-ci paraît faible en comparaison des millions d’euros que peuvent coûter un transfert raté ou une série de défaites. Il est aussi nécessaire qu’une nouvelle génération d’entraîneurs, avec un œil bienveillant sur ces nouvelles technologies, prennent en main les clubs – une collaboration profonde étant nécessaire. L’objectif final, lui, est toujours le même: "Comment faire gagner mon équipe?".

 

 

Pour ceux que cela intéresse, toutes les présentations sont détaillées chez CôtéStats.

Partager

> du même auteur

À fond les ballons

Cultures football


Jérôme Latta
2017-11-29

Le football entre au musée mais en ressort vivant

Actuellement présentée au Mucem de Marseille, l'exposition "Nous sommes foot" pose la question de la légitimité du football dans un tel endroit, et y répond en la démontrant brillamment. 


Osvaldo Piazzolla
2017-11-20

Comment les jeux vidéo de foot influencent la réalité... et inversement

Si FIFA, loin des jeux d'antan, individualise les performances et héroïse ses stars, Football Manager est dans une logique inverse. Celle du big data.


Christophe Zemmour
2017-10-16

Docteur Socrates, l’ivre de liberté

Bibliothèque – Dans son livre Docteur Socrates, Andrew Downie décrit bien plus qu’un footballeur ou un médecin. Il y relate la construction d’un homme libre qui accomplit sa destinée de guide.


>> tous les épisodes du thème "Cultures football"

Sur le fil

RT @tleplat: Cet inquiétant "entraîneur étranger" https://t.co/Vfk5rKaBrV via @Eurosport_FR

Publication de la thèse "Analyse statistique de tous les types d’objets utilisables par des enfants pour jouer au f… https://t.co/6y09urhryr

RT @RemiBelot: Apparemment l'écharpe de foot serait devenue un accessoire de mode (en attendant le bonnet). https://t.co/aq7ALudv8g

Les Cahiers sur Twitter

Les brèves

Adolphe un mec

"Un scandaleux tifo à la gloire d'Hitler." (football.fr)

Fanchone week

"Dupraz : 'Dix mannequins toulousains sur la pelouse'." (lequipe.fr)


Lâche investigation

"Pierre Ménès tacle Elise Lucet." (20 minutes)

Gerrard Majax

"L'excuse magique de Steven Gerrard." (lequipe.fr)

Retour au lycée

"Messi : une première en quatre ans." (sports.fr)