auteur
Julien Assunção et @OMalytics

Du même auteur

> article précédent

Improbable dernière minute

Opta Forum 2017, une fenêtre sur le futur des statistiques ?

Le grand rendez-vous annuel de la data a ouvert quelques portes sur ce que pourrait être l'avenir d'outils d'analyses du football. Avec ce que cela comprend d'imperfections comme de promesses... Analyse détaillée.

Partager

 

Le 8 février 2017 a eu lieu à Londres le dernier "OptaPro Analytics Forum". C’est la quatrième itération de ce rassemblement d’analystes (plus ou moins) amateurs et de professionnels du sport autour de conférences sur la statistique dans le football. Comme son nom l’indique, cet événement est organisé par la société Opta, principal fournisseur de données statistiques.

 

La participation étant ouverte à tous, soixante-dix propositions de présentations ont été évalués par un panel de juges, qui en ont sélectionné onze. Il faut aussi ajouter celle de Dennis Lock, "Director of Analytics" aux Miami Dolphins (franchise de NFL). Voici les différentes tendances qui ressortent repérées lors de cet OptaPro Forum 2017.

 

 

L’arrivée des données de tracking

Grâce au partenariat avec TRACAB, Opta mettait pour la première fois à disposition des participants des "tracking data": des données détaillées qui suivent la position des vingt-deux acteurs et du ballon. Martin Eastwood a choisi de mettre à profit ces informations pour évaluer la prise de décision d’un joueur aux abords de la surface à partir de la position du porteur de balle, de ses partenaires et des adversaires. Probablement la première fois qu’un modèle combine Expected Goals et position des joueurs.

 

 

 

 

William Spearman s’en sert lui pour évaluer la probabilité de réussite d’une passe. Les données de TRACAB servent ici à définir les paramètres initiaux de la passe: emplacement/vitesse de la balle et des joueurs. Cela permet de mesurer les qualités de passeur d’un joueur de manière bien plus efficace que les modèles actuels en étudiant le pressing adverse mais aussi en isolant les qualités de contrôle de la cible, facteur que ne maîtrise pas le passeur.

 

À l’heure où placer "Big Data" un peu partout semble être tendance, le terme s’applique bien ici. Avec 3,51 millions de valeurs mesurées par match, on touche aussi la limite de ces mesures. Tout est démultiplié, la puissance de calcul mais aussi le nombre d’analystes nécessaires pour profiter de ce foisonnement de données. Difficile donc de s’en servir en cours de match.

 

On imagine toutefois assez vite l’impact que peut avoir leur utilisation, notamment sur tout l’aspect défensif, où le principal se passe sans le ballon. La prise en compte des défenseurs dans un modèle d’Expected Goals par exemple, mais aussi connaître la distance moyenne entre un défenseur et son vis-à-vis. Le champ des possibles est tellement important qu’il faudra savoir sélectionner les informations pertinentes. Impossible également d’imaginer les blogeurs amateurs avoir accès à ce type de données. Une révolution qui devrait donc se faire dans l’ombre?

 

 

Les Expected Goals comme outils

En parlant d’Expected Goals, ceux-ci ne sont plus utilisés comme une fin en soi mais comme un outil de mesure. C’était le cas dans la présentation de Martin Eastwood, où l’auteur considère qu’une bonne décision est une action qui maximise la valeur de l’Expected Goal. Par leur caractère plus objectif et prédictif, ils peuvent donc remplacer les buts pour estimer la réussite d’une stratégie. Ils sont également de plus en plus utilisés en association avec un autre modèle statistique.

 

On ressent cette évolution dans la conférence de Neil Charles sur la manière d’optimiser les zones de tirs, où ils sont combinés à un modèle estimant la difficulté d’une passe. Le but étant de définir la frontière où tirer devient une meilleure option que la passe vers un coéquipier.

 

"Probabilité de marquer des différentes options de Ross Barkley"


 

Les Expected Goals sont un outil de diagnostic puissant mais limité tactiquement. Une fois que l’on connait les zones préférentielles de tirs, on a besoin de savoir comment y accéder. Une démarche que l’on retrouve dans la présentation de Garry Gelade sur l’art de centrer, lequel explore les types de centres les plus efficaces. Alors que cette statistique fait son entrée dans les médias grand public (BBC, Canal+, etc.), elle a déjà été plus ou moins digérée par les analystes, qui passent désormais à l’étape suivante.

 

 

Des tirs aux passes

L'intérêt des analystes s'est en effet d'abord concentré sur les tirs, pour l'importance qu'ils ont quant au résultat final mais aussi car les données sont plus accessibles et relativement simples à manipuler. Pour autant, ce sont bien les passes qui constituent le cœur du football et l'action la plus courante exécutée par un joueur. D'où l'investissement progressif de ce secteur du jeu.

 

 

"Évolution des différents types d’attaque en proportion des tirs (PL saisons 12/13 à 16/17)"

 
 

L'étude des passes a de plus l'avantage de se rapprocher des préoccupations tactiques des entraîneurs, et donne lieu à une variété d'approches que les tirs n'offraient pas:

 

• Une approche stylistique ou qualitative comme celle de Will Gürpinar-Morgan qui montre comment identifier et analyser les stratégies d’équipe, ou celle de Bobby Gardiner et Joel Becker relative aux entraîneurs et leur style de jeu, qui se servent également des passes pour créer un certain nombre de métriques qualitatives.

 

• Une approche quantitative comme celle de William Spearman qui utilise les données de tracking pour aller au-delà du simple pourcentage de passes réussies et évaluer les passes de manière holistique.

 

• Une approche hybride par David Perdomo Meza qui identifie des tendances au niveau collectif uniquement sur la base des joueurs qui composent les séquences de passes et qui en déduit ensuite une évaluation individuelle.

 

On le voit, l'attention portée aux passes est pleine de promesses et représente également une opportunité unique d'appliquer un éventail d'outils mathématiques qui vont de la topologie aux algorithmes d'intelligence artificielle.

 

 

 

De nouveaux outils statistiques

Les articles de la communauté "Football Analytics" s'appuient sur un éventail d'outils statistiques de plus en plus large et le forum 2017 nous en a donné une belle illustration. Bien qu'elles ne soient pas nécessairement nouvelles, l'utilisation publique de ces techniques appliquées au football est en revanche relativement récente.

 

Martin Eastwood a navigué entre différentes méthodes pour son application: "réseaux neuronal", "machines à vecteurs de support", avant d’opter pour une régression logistique plus classique. Neil Charles a lui utilisé un algorithme dit "forêt d’arbres décisionnels" pour créer son modèle d’Expected Passes.

 

 

"Forêt d’arbres décisionnels"

 
 

Ces méthodes complexes à appréhender mais relativement simples à implémenter donnent bien souvent des résultats plus précis (au prix parfois d’un besoin calculatoire plus important) mais pèchent par l’interprétabilité de leurs résultats.

 

On touche ici à notre avis à la principale barrière à l'entrée des statistiques dans le football: pour être adoptés par les principaux acteurs du secteur sportif d’un club, il faut que les résultats soient compréhensibles et assimilables par des non-initiés. Les analystes ont de leur côté un travail à faire pour présenter le résultat de leur travail avec pédagogie et honnêteté.

 

Via la présentation de Constantinos Chappas sur l’incertitude des métriques, on voit comment peut (doit?) être présenté le travail d’un analyste: en montrant de manière explicite les données utilisées, les calculs et surtout le niveau de confort quant aux résultats des travaux.

 

 

 

 

Pour cela, l’approche dite bayésienne et les intervalles crédibles qu'elle permet de calculer sont à la fois relativement transparents et simples à appréhender. Plutôt qu’un intervalle de confiance, souvent mal interprété, l’intervalle crédible nous donne le pourcentage de chance qu’un paramètre soit compris entre deux valeurs. Les modèles ont par nature un niveau inhérent d'incertitude et il convient d'en informer les utilisateurs.

 

Le chemin est donc étroit pour les statistiques dans le football, qui doivent naviguer entre de multiples écueils: la complexité des méthodes, la difficulté d'interprétation des résultats, la sur-simplification mais aussi faire face aux réticences d'un sport dont la plupart des acteurs doivent encore être convaincus de leur pertinence.

 

 

De l’importance du style de jeu

Une autre tendance de ces derniers mois et que l’on retrouve sur cet OptaPro Forum est l’emphase mise sur la manière plutôt que le résultat.

 

Il est évidemment intéressant de savoir quelles équipes/joueurs sont les plus performants, mais savoir analyser le style de jeu utilisé a de nombreux avantages. Il permet, par exemple, de se préparer à un type d’attaque en particulier ou exploiter une faiblesse de l’adversaire. Cela importe également dans la phase de recrutement, où il ne suffit pas de prendre un bon joueur/entraîneur pour que son arrivée soit une réussite. D’autant plus que la plupart des statistiques sont d'ordre stylistique, donc grandement influencées par l’équipe dans laquelle un joueur évolue.

 

 

Côté joueurs, David Perdomo Meza aborde le sujet en utilisant les séquences de passes et Will Gürpinar-Morgan en s’intéressant aux différents types d’attaque selon la façon dont sont menées les phases de possession. Dans ces deux présentations, Leicester City est un cas d’école, une équipe systématiquement à part.

 

Bobby Gardiner et Joel Becker se sont, eux, posés une question: le style de jeu dépend-il des entraîneurs? Cela peut sembler évident mais c’est important de le chiffrer, notamment pour éviter des nominations parfois vouées à l’échec. Dans un sport qui brasse autant d’argent, les présidents de club doivent le moins possible laisser la place au hasard.

 

 

Conclusion

Le forum Opta est un des rares lieux (après Twitter) où les analystes amateurs peuvent présenter leur travail aux acteurs du monde professionnel. Ces amateurs sont de plus en plus nombreux sur internet mais, paradoxalement, les travaux novateurs semblent se tarir. Les "fanalysts" oscillent en effet entre peur de voir leurs productions récupérées directement par les clubs et besoin de se faire connaître.

 

Un intérêt des clubs qui se matérialise par les cinquante équipes représentées au forum, que ce soit au niveau de l’équipe première ou du centre de formation. Avec de l’avance pour les équipes anglaises et allemandes, le Paris Saint-Germain étant le seul représentant français. Pour autant, les passerelles fonctionnent-elles réellement? On compte actuellement sur les doigts d’une main les amateurs passés pros au sein de clubs. Est-ce une question d’offre (les clubs n’ouvrent pas de recrutements sur ce type de poste), de demande (les profils disponibles ne correspondent pas aux besoins) ou de canal de recrutement (les clubs piochent en dehors de la communauté)?

 

L’exemple des sports américains tend à nous faire pencher vers la première option: la valeur des statistiques est reconnue au sein des clubs mais la création d’équipes de statisticiens / data scientists en interne met du temps à se mettre en place ou se fait en interne via l’utilisation de staff déjà présent (analystes vidéo en particulier). Reste à savoir si c'est le meilleur moyen de tirer parti de toutes ces données.

 

Aussi étonnant que cela puisse paraître, c’est l’argument financier qui est souvent avancé par les clubs refusant d’investir dans ce domaine. La mise en place d’un service dédié à l’analyse statistique et l’obtention des données nécessaires a effectivement un coût mais celui-ci paraît faible en comparaison des millions d’euros que peuvent coûter un transfert raté ou une série de défaites. Il est aussi nécessaire qu’une nouvelle génération d’entraîneurs, avec un œil bienveillant sur ces nouvelles technologies, prennent en main les clubs – une collaboration profonde étant nécessaire. L’objectif final, lui, est toujours le même: "Comment faire gagner mon équipe?".

 

 

Pour ceux que cela intéresse, toutes les présentations sont détaillées chez CôtéStats.

Partager

> déconnerie

Le Facebook du PSG

> du même auteur

Mauvais sang

Cultures football


Osvaldo Piazzolla
2018-02-15

Les aventures de Velasca au pays des équipementiers

Comment un club au niveau sportif tout à fait insignifiant a renversé le rapport des marques au merchandising. Bienvenue à l'AS Velasca, club de football et entreprise esthétique.


Raphaël Le Magoariec
2018-02-13

Le football frappé par la crise du Golfe

Relocalisée, parfois douteuse sur le plan arbitral, d'une grande tension dramatique en finale et au vainqueur omanais célébré avec enthousiasme par... le Qatar, la dernière Coupe du Golfe a symbolisé les tensions dans cette partie du globe.


Mark Sanderson
2018-01-16

Delta 1000, balle populaire

When Saturday Comes – Revisité dans une version que n'a pas appréciée Pep Guardiola, le Mitre Delta 1000 original était la référence anglaise du ballon de football dans les années 80 et 90. 


>> tous les épisodes du thème "Cultures football"

Sur le fil

RT @Demanagerscdf: Le jeu de Chelsea analysé avant le choc face au Barça https://t.co/qEroGmYcw9

RT @a_la_nantaise: Pour une nouvelle modernisation du stade de la Beaujoire, A la nantaise a trouvé 20 millions ! https://t.co/TB33GaPcxn

RT @a_la_nantaise: Avec le plus grand respect pour l'ensemble des acteurs, A la nantaise appelle tous les amoureux du FC Nantes à s'inscrir…

Les Cahiers sur Twitter

Le forum

Jeux d'Olympe

aujourd'hui à 04h14 - La Metz Est Dite : Yep, Cassie Sharpe nettement au dessus du lot.Ça existait déjà aux Jeux d'hiver précédents... >>


Le Palet des Glaces

aujourd'hui à 03h50 - Gouffran direct : You gotta believe dude! >>


Foot et politique

aujourd'hui à 02h22 - La Metz Est Dite : Jean Luc Etourdi18/02/2018 à 12h14"Tiens, les partisans d'un fil dédié au porno pourront compter... >>


Paris est magique

aujourd'hui à 01h49 - cocobeloeil : (Oui, certes, les cartons sont un autre problème..!) >>


Scapulaire conditionné

aujourd'hui à 01h35 - cocobeloeil : Ouais bah bon, c'est toujours pas transcendant, mais laissez moi vous dire que notre super coach... >>


LA GAZETTE : les minutes

aujourd'hui à 00h55 - Moravcik dans les prés : (tu es pardonné, elle est magnifique celle-là) >>


LA GAZETTE : Les gestes / Les antigestes

aujourd'hui à 00h50 - Moravcik dans les prés : Gestes :Le coup de fusil de Luiz Araujo au ras du poteau d'Anthony Lopes.La si belle passe en... >>


Premier League et foot anglais

aujourd'hui à 00h50 - Charterhouse11 : Au temps pour moi alors ! Ca m'apprendra à croire des infos pourtant relayée par quelques... >>


Gerland à la détente

19/02/2018 à 23h50 - Hyoga : gurneyaujourd'hui à 18h09Sauf que le problème c'est que les 12 maisons des chevaliers d'or c'est... >>


Observatoire du journalisme sportif

19/02/2018 à 23h34 - Run : Tiens, j’en profite pour lever mon petit chapeau aux gars de Lucarne Opposee qui nous font vivre... >>


Les brèves

Encore un entraîneur émincé

"Nancy : c'est fini pour Hognon." (lequipe.fr)

Guy Roux manager

“ANG : ‘Vivement la VAR !’" (lequipe.fr)

Chaude Baysse

"Baysse à Bordeaux, ça brûle." (lequipe.fr)

Mikaelle Andro

"En Iran, la fille rebelle qui, déguisée en homme, est entrée dans un stade de foot." (lemonde.fr)
Feinte de corps réussie.

Huggies, le bon tuyau

"Le maillot 2018-2019 du PSG a fuité." (lequipe.fr)