auteur
Julien Assunção et @OMalytics

Du même auteur

> article précédent

Improbable dernière minute

Opta Forum 2017, une fenêtre sur le futur des statistiques ?

Le grand rendez-vous annuel de la data a ouvert quelques portes sur ce que pourrait être l'avenir d'outils d'analyses du football. Avec ce que cela comprend d'imperfections comme de promesses... Analyse détaillée.

Partager

 

Le 8 février 2017 a eu lieu à Londres le dernier "OptaPro Analytics Forum". C’est la quatrième itération de ce rassemblement d’analystes (plus ou moins) amateurs et de professionnels du sport autour de conférences sur la statistique dans le football. Comme son nom l’indique, cet événement est organisé par la société Opta, principal fournisseur de données statistiques.

 

La participation étant ouverte à tous, soixante-dix propositions de présentations ont été évalués par un panel de juges, qui en ont sélectionné onze. Il faut aussi ajouter celle de Dennis Lock, "Director of Analytics" aux Miami Dolphins (franchise de NFL). Voici les différentes tendances qui ressortent repérées lors de cet OptaPro Forum 2017.

 

 

L’arrivée des données de tracking

Grâce au partenariat avec TRACAB, Opta mettait pour la première fois à disposition des participants des "tracking data": des données détaillées qui suivent la position des vingt-deux acteurs et du ballon. Martin Eastwood a choisi de mettre à profit ces informations pour évaluer la prise de décision d’un joueur aux abords de la surface à partir de la position du porteur de balle, de ses partenaires et des adversaires. Probablement la première fois qu’un modèle combine Expected Goals et position des joueurs.

 

 

 

 

William Spearman s’en sert lui pour évaluer la probabilité de réussite d’une passe. Les données de TRACAB servent ici à définir les paramètres initiaux de la passe: emplacement/vitesse de la balle et des joueurs. Cela permet de mesurer les qualités de passeur d’un joueur de manière bien plus efficace que les modèles actuels en étudiant le pressing adverse mais aussi en isolant les qualités de contrôle de la cible, facteur que ne maîtrise pas le passeur.

 

À l’heure où placer "Big Data" un peu partout semble être tendance, le terme s’applique bien ici. Avec 3,51 millions de valeurs mesurées par match, on touche aussi la limite de ces mesures. Tout est démultiplié, la puissance de calcul mais aussi le nombre d’analystes nécessaires pour profiter de ce foisonnement de données. Difficile donc de s’en servir en cours de match.

 

On imagine toutefois assez vite l’impact que peut avoir leur utilisation, notamment sur tout l’aspect défensif, où le principal se passe sans le ballon. La prise en compte des défenseurs dans un modèle d’Expected Goals par exemple, mais aussi connaître la distance moyenne entre un défenseur et son vis-à-vis. Le champ des possibles est tellement important qu’il faudra savoir sélectionner les informations pertinentes. Impossible également d’imaginer les blogeurs amateurs avoir accès à ce type de données. Une révolution qui devrait donc se faire dans l’ombre?

 

 

Les Expected Goals comme outils

En parlant d’Expected Goals, ceux-ci ne sont plus utilisés comme une fin en soi mais comme un outil de mesure. C’était le cas dans la présentation de Martin Eastwood, où l’auteur considère qu’une bonne décision est une action qui maximise la valeur de l’Expected Goal. Par leur caractère plus objectif et prédictif, ils peuvent donc remplacer les buts pour estimer la réussite d’une stratégie. Ils sont également de plus en plus utilisés en association avec un autre modèle statistique.

 

On ressent cette évolution dans la conférence de Neil Charles sur la manière d’optimiser les zones de tirs, où ils sont combinés à un modèle estimant la difficulté d’une passe. Le but étant de définir la frontière où tirer devient une meilleure option que la passe vers un coéquipier.

 

"Probabilité de marquer des différentes options de Ross Barkley"


 

Les Expected Goals sont un outil de diagnostic puissant mais limité tactiquement. Une fois que l’on connait les zones préférentielles de tirs, on a besoin de savoir comment y accéder. Une démarche que l’on retrouve dans la présentation de Garry Gelade sur l’art de centrer, lequel explore les types de centres les plus efficaces. Alors que cette statistique fait son entrée dans les médias grand public (BBC, Canal+, etc.), elle a déjà été plus ou moins digérée par les analystes, qui passent désormais à l’étape suivante.

 

 

Des tirs aux passes

L'intérêt des analystes s'est en effet d'abord concentré sur les tirs, pour l'importance qu'ils ont quant au résultat final mais aussi car les données sont plus accessibles et relativement simples à manipuler. Pour autant, ce sont bien les passes qui constituent le cœur du football et l'action la plus courante exécutée par un joueur. D'où l'investissement progressif de ce secteur du jeu.

 

 

"Évolution des différents types d’attaque en proportion des tirs (PL saisons 12/13 à 16/17)"

 
 

L'étude des passes a de plus l'avantage de se rapprocher des préoccupations tactiques des entraîneurs, et donne lieu à une variété d'approches que les tirs n'offraient pas:

 

• Une approche stylistique ou qualitative comme celle de Will Gürpinar-Morgan qui montre comment identifier et analyser les stratégies d’équipe, ou celle de Bobby Gardiner et Joel Becker relative aux entraîneurs et leur style de jeu, qui se servent également des passes pour créer un certain nombre de métriques qualitatives.

 

• Une approche quantitative comme celle de William Spearman qui utilise les données de tracking pour aller au-delà du simple pourcentage de passes réussies et évaluer les passes de manière holistique.

 

• Une approche hybride par David Perdomo Meza qui identifie des tendances au niveau collectif uniquement sur la base des joueurs qui composent les séquences de passes et qui en déduit ensuite une évaluation individuelle.

 

On le voit, l'attention portée aux passes est pleine de promesses et représente également une opportunité unique d'appliquer un éventail d'outils mathématiques qui vont de la topologie aux algorithmes d'intelligence artificielle.

 

 

 

De nouveaux outils statistiques

Les articles de la communauté "Football Analytics" s'appuient sur un éventail d'outils statistiques de plus en plus large et le forum 2017 nous en a donné une belle illustration. Bien qu'elles ne soient pas nécessairement nouvelles, l'utilisation publique de ces techniques appliquées au football est en revanche relativement récente.

 

Martin Eastwood a navigué entre différentes méthodes pour son application: "réseaux neuronal", "machines à vecteurs de support", avant d’opter pour une régression logistique plus classique. Neil Charles a lui utilisé un algorithme dit "forêt d’arbres décisionnels" pour créer son modèle d’Expected Passes.

 

 

"Forêt d’arbres décisionnels"

 
 

Ces méthodes complexes à appréhender mais relativement simples à implémenter donnent bien souvent des résultats plus précis (au prix parfois d’un besoin calculatoire plus important) mais pèchent par l’interprétabilité de leurs résultats.

 

On touche ici à notre avis à la principale barrière à l'entrée des statistiques dans le football: pour être adoptés par les principaux acteurs du secteur sportif d’un club, il faut que les résultats soient compréhensibles et assimilables par des non-initiés. Les analystes ont de leur côté un travail à faire pour présenter le résultat de leur travail avec pédagogie et honnêteté.

 

Via la présentation de Constantinos Chappas sur l’incertitude des métriques, on voit comment peut (doit?) être présenté le travail d’un analyste: en montrant de manière explicite les données utilisées, les calculs et surtout le niveau de confort quant aux résultats des travaux.

 

 

 

 

Pour cela, l’approche dite bayésienne et les intervalles crédibles qu'elle permet de calculer sont à la fois relativement transparents et simples à appréhender. Plutôt qu’un intervalle de confiance, souvent mal interprété, l’intervalle crédible nous donne le pourcentage de chance qu’un paramètre soit compris entre deux valeurs. Les modèles ont par nature un niveau inhérent d'incertitude et il convient d'en informer les utilisateurs.

 

Le chemin est donc étroit pour les statistiques dans le football, qui doivent naviguer entre de multiples écueils: la complexité des méthodes, la difficulté d'interprétation des résultats, la sur-simplification mais aussi faire face aux réticences d'un sport dont la plupart des acteurs doivent encore être convaincus de leur pertinence.

 

 

De l’importance du style de jeu

Une autre tendance de ces derniers mois et que l’on retrouve sur cet OptaPro Forum est l’emphase mise sur la manière plutôt que le résultat.

 

Il est évidemment intéressant de savoir quelles équipes/joueurs sont les plus performants, mais savoir analyser le style de jeu utilisé a de nombreux avantages. Il permet, par exemple, de se préparer à un type d’attaque en particulier ou exploiter une faiblesse de l’adversaire. Cela importe également dans la phase de recrutement, où il ne suffit pas de prendre un bon joueur/entraîneur pour que son arrivée soit une réussite. D’autant plus que la plupart des statistiques sont d'ordre stylistique, donc grandement influencées par l’équipe dans laquelle un joueur évolue.

 

 

Côté joueurs, David Perdomo Meza aborde le sujet en utilisant les séquences de passes et Will Gürpinar-Morgan en s’intéressant aux différents types d’attaque selon la façon dont sont menées les phases de possession. Dans ces deux présentations, Leicester City est un cas d’école, une équipe systématiquement à part.

 

Bobby Gardiner et Joel Becker se sont, eux, posés une question: le style de jeu dépend-il des entraîneurs? Cela peut sembler évident mais c’est important de le chiffrer, notamment pour éviter des nominations parfois vouées à l’échec. Dans un sport qui brasse autant d’argent, les présidents de club doivent le moins possible laisser la place au hasard.

 

 

Conclusion

Le forum Opta est un des rares lieux (après Twitter) où les analystes amateurs peuvent présenter leur travail aux acteurs du monde professionnel. Ces amateurs sont de plus en plus nombreux sur internet mais, paradoxalement, les travaux novateurs semblent se tarir. Les "fanalysts" oscillent en effet entre peur de voir leurs productions récupérées directement par les clubs et besoin de se faire connaître.

 

Un intérêt des clubs qui se matérialise par les cinquante équipes représentées au forum, que ce soit au niveau de l’équipe première ou du centre de formation. Avec de l’avance pour les équipes anglaises et allemandes, le Paris Saint-Germain étant le seul représentant français. Pour autant, les passerelles fonctionnent-elles réellement? On compte actuellement sur les doigts d’une main les amateurs passés pros au sein de clubs. Est-ce une question d’offre (les clubs n’ouvrent pas de recrutements sur ce type de poste), de demande (les profils disponibles ne correspondent pas aux besoins) ou de canal de recrutement (les clubs piochent en dehors de la communauté)?

 

L’exemple des sports américains tend à nous faire pencher vers la première option: la valeur des statistiques est reconnue au sein des clubs mais la création d’équipes de statisticiens / data scientists en interne met du temps à se mettre en place ou se fait en interne via l’utilisation de staff déjà présent (analystes vidéo en particulier). Reste à savoir si c'est le meilleur moyen de tirer parti de toutes ces données.

 

Aussi étonnant que cela puisse paraître, c’est l’argument financier qui est souvent avancé par les clubs refusant d’investir dans ce domaine. La mise en place d’un service dédié à l’analyse statistique et l’obtention des données nécessaires a effectivement un coût mais celui-ci paraît faible en comparaison des millions d’euros que peuvent coûter un transfert raté ou une série de défaites. Il est aussi nécessaire qu’une nouvelle génération d’entraîneurs, avec un œil bienveillant sur ces nouvelles technologies, prennent en main les clubs – une collaboration profonde étant nécessaire. L’objectif final, lui, est toujours le même: "Comment faire gagner mon équipe?".

 

 

Pour ceux que cela intéresse, toutes les présentations sont détaillées chez CôtéStats.

Partager

Cultures football


Christophe Kuchly
2018-11-28

José Mourinho et Pep Guardiola, destins croisés de deux anciens Barcelonais

Bibliothèque – Dans The Barcelona Legacy, Jonathan Wilson raconte l'évolution du jeu depuis trente ans à travers l'influence de l'école barcelonaise depuis le passage de Johan Cruyff en tant que coach.


Christophe Zemmour
2018-11-26

The Anatomy of Manchester United

Bibliothèque – Dans un ouvrage riche, Jonathan Wilson s’exerce à l’un de ses formats favoris, pour raconter l’histoire de Manchester United à travers dix dates clés.


Christophe Kuchly
2018-11-13

Le football et ses hommes d'ombre

Bibliothèque – Dans La Mano Negra, Romain Molina raconte la vie des super-agents, ces hommes aux multiples passeports et dates de naissances, qui font et défont le foot en fumant des gros cigares.


>> tous les épisodes du thème "Cultures football"

Sur le fil

H-12 https://t.co/AyeIa8MLZe

RT @banquetteNE: Dans le dernier épisode de Banquette, @Romain_Molina évoque au micro d’@AbdallahSoidri les oligarques russes qui se paient…

[rappel] Le précieux Journal du jeu de @CKuchly nous parle de l’excellence de Messi, de la prudence de Chelsea et d… https://t.co/OLAm3XGbOZ

Les Cahiers sur Twitter

Le forum

Gerland à la détente

aujourd'hui à 11h41 - Jus de Nino : Vénère je sais pas mais sa rentrée au vestiaire est peut être plus due au froid ? Sur les... >>


Santiago Bernabeu

aujourd'hui à 11h37 - Tonton Danijel : CHR$12/12/2018 à 21h53Ben, justement, tu as d'un côté des Moscovites surdéterminés par l'enjeu... >>


Bréviaire

aujourd'hui à 11h30 - Pascal Amateur : ravio aérienVision d'hublot "Tousart : 'On a tous fait le job'." (lequipe.fr) >>


Foot et politique

aujourd'hui à 11h30 - J'ai remis tout l'allant : Rien de bien nouveau, suppdebastille, si ce n'est que l'érosion s'accélère : depuis, Macron a... >>


Paris est magique

aujourd'hui à 11h24 - Mix Diskerud : JeanLoupGarouaujourd'hui à 08h41City-Atletico est un tirage extrêmement probable (City évite... >>


Observatoire du journalisme sportif

aujourd'hui à 11h13 - beltramaxi : JeanLoupGarouaujourd'hui à 10h18Si le PSG a coupé les micros de l'équipe, effectivement c'est... >>


Le fil prono

aujourd'hui à 10h57 - Gouff : COTY WEEK 15Chargers@Chiefs 20-28Browns@Broncos 17-14Texans@Jets 23-21Cardinals@Falcons... >>


CDF sound system

aujourd'hui à 09h52 - Pascal Amateur : Ah, ah, ah, mon pauvre poiuyt, si tu voyais ce qui se joue dans ce rêve ! (Je déconne, j'en sais... >>


L'empire d'essence

aujourd'hui à 08h30 - Nos meilleures Sané : Run05/12/2018 à 19h14Les teams ont vote pour leur top 10 des pilotes. Voici le resultat.1. Lewis2.... >>


Dans le haut du panier

aujourd'hui à 06h56 - Gouffran direct : Énorme faute de Green sur JV.Pas de faute.Pas grave, gros gros match de démonstration des... >>


Les brèves

Happy Neuer

Neuer : 'Finir l'année sur une bonne note'." (lequipe.fr)
Et en avant la Munich !

Malcolm Leaks

"Quand Malcolm enfile le maillot de l'OM." (lequipe.fr)

Emile Louis-II

"Les ‘combines’ de Monaco pour attirer les joueurs mineurs." (lequipe.fr)

Je crois keupon

"Laurent Blanc n'a esquivé aucun sujet. Même ceux qui fâchent..." (lequipe.fr)

Michel derche accueillant

"C'est devenu Montpellier Eros." (France Football)