Le cable réseau du serveur étant presque saturé, merci de ne vous connecter qu'en cas d'absolue nécessité de vous amuser. Attention à ne pas confondre vos minuscules et vos majuscules.
Vous avez oublié votre mot de passe ?
Inscription
Vous avez oublié votre mot de passe ? Il reste un espoir ! Saisissez votre adresse e-mail ; nous vous enverrons un nouveau mot de passe. Cette procédure est quasiment gratuite : elle ne vous coûtera qu'un clic humiliant.
Nous vous avons envoyé un email sur votre adresse, merci d'y jeter un oeil !

CONDITIONS D'INSCRIPTION :

1. Vous devez nous adresser, via le formulaire ci-dessous, un texte (format .txt inférieur à 100 ko) en rapport avec le football, dont la forme est libre : explication de votre passion, anecdote, aventure, souvenir, essai, commentaire composé, portrait, autobiographie, apologie, réquisitoire, etc. Vous serez ensuite informés de la validation de votre inscription par mail. Les meilleurs textes seront mis en ligne sur le Forum.

2. Nous ne disposons pas d'assez de temps pour justifier les retards d'inscription ou les non-inscriptions, et ne pouvons pas nous engager à suivre une éventuelle correspondance à ce sujet. Merci de votre compréhension.

Nous avons bien reçu votre candidature, on y jette un oeil dès que possible. Merci !

Partager :

Data et football : une relation en construction

Loin d'être à un niveau aussi avancé que dans certains sports américains où mesurer les données est facile, le ballon rond est encore analysé de manière superficielle. Les enjeux de la data sont pourtant grands.

Auteur : Osvaldo Piazzolla le 8 Août 2016

 

 

* * * Article initialement publié sur The Conversation * * *

 

Comment quantifier le foot? Toute tentative de définition, de production et d’organisation des données dans ce domaine suppose de répondre à quelques questions, par exemple: qu’est-ce qu’une passe, en football? On peut facilement imaginer qu’il y a une façon consensuelle de considérer qu’une passe est tentée, qu’une passe est réussie. Il est moins évident à définir qu’une passe est décisive (c’est-à-dire qu’elle entraîne un but). Jusqu’à ce que les ligues de football essayent d’harmoniser leurs définitions, les passes comptées comme "décisives" ici ne l’étaient pas forcément là.

 

En France, vous pouviez dribbler toute l’équipe adverse et faire une passe lumineuse qui ne laisse plus à l’attaquant qu’à pousser mollement le ballon aux fonds des filets: si jamais l’attaquant la contrôlait avant de marquer, alors votre passe n’était pas décisive. Alors qu’en Angleterre, vous pouviez passer dans votre propre surface un ballon approximatif de deux mètres à un partenaire qui s’en allait dribbler toute l’équipe adverse avant de marquer: vous étiez l’avant-dernière personne à avoir touché le ballon, votre passe était décisive. Deuxième question: qu’est ce qu’un centre? On imagine bien qu’il faut, pour qu’une passe soit considérée comme un centre, qu’elle parte d’une certaine zone sur les côtés du terrain, et arrive dans une autre. Mais quelle zone exactement?

 

Mint Digital/Flickr

 

 

Paramètres observables

Troisième question: qu’est-ce qu’un dribble? Tous ces concepts sont propres au football, ils sont aisément compris, discutés, évalués par des centaines de millions de gens qui s’intéressent au football dans le monde entier. Mais comment les transformer en paramètres observables, en "données" qui seront ensuite exploitées par des armées d’analystes ou de statisticiens? Comment définir "objectivement" (ou plutôt, pour ne pas employer de gros mots épistémiques, "de manière consensuelle") ce qu’est un dribble, et ce qu’est un dribble réussi, de manière à ce que cette définition produise un paramètre qui soit précis, mesurable, reproductible, et standardisé?

 

Ce n’est pas impossible, mais c’est loin d’être évident, d’autant plus que de nombreux analystes produisent des statistiques sur les joueurs ou les équipes qui dribblent le plus ou le mieux, sans pouvoir répondre à ces questions. Certains disent que la "donnée brute" est un oxymore, d’autres que la "donnée" est bien mal nommée et devrait s’appeler "obtenue". Ils veulent tous signifier qu’il est spécieux de faire des analyses quantitatives sans s’interroger d’où viennent les "données", en football comme ailleurs.

 

 

Choix de définitions

La "donnée" est d’abord pensée: imaginer un paramètre (la passe, le tir, l’expected goal, le ball movement point), c’est avoir une certaine idée de comment représenter le match (ou la saison), et le concept de ce paramètre est déjà une certaine vision du football, qui va être traduite et va performer. Définir la "donnée" n’est pas neutre non plus: définit-on le dribble topologiquement par un espace gagné balle au pied? Par des adversaires "éliminés"? Ces choix de définitions ne donneront pas la même valeur aux joueurs rapides et aux joueurs provocateurs.

 

Mesurer la donnée n’est pas non plus facile. Qui s’en charge? Des entreprises dont le business model est lié à une divulgation partielle de leurs méthodes (pour créer un produit d’appel) et un secret global (en situation concurrentielle). Avec quels choix techniques? La multiplicité de témoins humains enregistreurs? Ou bien fait-on appel à de la détection vidéo informatisée? Comment la reproductibilité est-elle gérée? Enfin, comment standardiser? Comment arriver à un consensus scientifique si la production de données provient d’entreprises concurrentes? Et comment ensuite les rendre intelligibles, accessibles, donc performatives?

 

Toutes ces questions ne signifient pas que ces méthodes sont illusoires et sans intérêt. Elles sont au contraire d’autant plus intéressantes! Au-delà d’une opposition naïve entre technophilie béate et technophobie grincheuse, toutes ces questions sont importantes à déconstruire dans toute tentative d’analyse de production scientifique, mais elles sont passionnantes dans le cas du football.

 

 

La donnée du foot au cœur de plusieurs industries

En effet, le football est au cœur d’enjeux économiques et culturels uniques. Ce sport, un peu comme la publicité, est une version caricaturale de notre société. Par exemple, observer ce qui se passe dans les tribunes des matches du Beitar Jérusalem en dit long sur l’agressivité de la société israélienne, mais comprendre les Ultras de l’Hapoël Tel-Aviv permet de le nuancer. Plus près de nous, les politiques de répression des ultras du foot en France sont, de l’aveu même des politiques, un laboratoire de la répression en général.

 

Pour rester dans notre sujet, la "donnée" dans le football est au cœur de plusieurs industries. Le marché du football lui-même (les transferts de joueurs, le marché des spectateurs…) n’en représente qu’une partie: d’un côté, l’industrie audiovisuelle est au cœur de ces enjeux par sa façon même de définir le spectacle qu’est le match de football télévisé. De l’autre (et non sans lien), l’industrie du pari sportif est structurellement liée à la quantification des probabilités et donc à l’utilisation industrielle de la donnée.

 

Le discours du besoin d’objectivité et de rationalité est typique d’un "régime de promesse technoscientifique". Comme pour les nanotechnologies par exemple, il s’agit de rendre inéluctable des choix techniques scientifiques et industriels. Mais la gouvernementalité de la donnée n’est pas le monopole d’un pouvoir unique, mais le lieu d’affrontements et d’intérêts divers et toutes ces questions scientifiques sont aussi des questions économiques, et politiques.

 

 

Maîtrise encore superficielle

Or le football, contrairement au baseball ou au basket-ball, par la nature même du jeu, se prête plus difficilement à la quantification. Il résiste à la donnée par sa complexité physique, tactique, stratégique et psychologique. Le domaine des football analytics est aujourd’hui dans un régime d’"adolescence" par rapport aux sports qui sont les success stories de la donnée, comme le baseball.

 

Quand un milliardaire américain achète le Liverpool FC, un des plus gros clubs de la planète, parce qu’il a été séduit par la success story hollywoodienne de Moneyball, il veut reproduire naïvement une belle histoire de baseball dans le football et son échec provoque les moqueries. Quand un entrepreneur dans l’industrie du pari sportif achète le Brentford FC, modeste club de Championship loin de l’actualité sportive internationale, les entremêlements entre le pari sportif, l’analyse de performance, le marché des joueurs sont à prendre au sérieux… pour comprendre comment se mettent en place les relations complexes entre "données" et football. Il s’agit de science, il s’agit d’économie, il s’agit de politique, il s’agit de culture.

 

Réactions

  • Sens de la dérision le 09/08/2016 à 17h01
    Il est très bien cet article polémique. Et la phrase que je retiendrais est "La "donnée" est d’abord pensée: imaginer un paramètre, c’est avoir une certaine idée de comment représenter le match (ou la saison), et le concept de ce paramètre est déjà une certaine vision du football[..]". C'est finalement assez classique en science (je pense, en particulier, à la médecine) où on ne peut pas tout mesurer et où l'on se concentre sur quelques points que l'on veut mettre en avant.

    Et je suis bien incapable de donner une définition de dribble.

  • osvaldo piazzolla le 09/08/2016 à 17h35
    Ah mais tout à fait, c'est un article d'histoire des sciences / épistémologie.

    J'ai commencé l'année dernière avec deux M1 et si quelqu'un qui traîne par ici est en master de socio / histoire des sciences / anthropo ou quelque chose d'approchant et veut faire son stage sur ce sujet qu'il me contacte maintenant ou se taise à tout jamais !

    lien

  • osvaldo piazzolla le 09/08/2016 à 23h55
    (ah et j'ai raconté porte nimhouaque : ce sont les positions moyennes de joueurs qui invisibilisent les permutations, pas les heat maps)

  • Zlatanist le 10/08/2016 à 09h11
    Cet article pose les bonnes questions.
    Ca fait plaisir de voir que je ne dois pas être le seul à m'énerver quand je vois des stats sur les "duels gagnés" commentées comme si elles avaient une valeur objective et absolue.
    D'abord c'est quoi un duel ? Et un défenseur qui anticipe une passe et l'intercepte 10 mètres devant l'attaquant qui a lâché l'affaire, il gagne un duel ? Gagner un ballon de la tête et le remettre dans la course d'un adversaire, c'est gagner un duel ?
    Bref il y a encore quantité de choses à définir... En attendant le plus simple est de se contenter des données brutes (distance parcourue, position moyenne etc.) même si elles sont frustrantes car elle ne donne pas toujours d'indication immédiate sur la qualité de la performance d'un joueur.

  • narcoleps le 10/08/2016 à 18h33
    Un des trucs gênants avec les data et ceux (certains de ceux, voire beaucoup) qui s'y réfèrent, c'est de souvent chercher à tout réduire à une stat' ultime, qui expliquerait tout et clôturerait définitivement tout débat (dernier exemple en date : les xG, un concept intéressant mais à manier avec d'énormes pincettes).

    C'est humain, ça fait partie du besoin de simplifier au maximum pour se rendre les événements plus facilement intelligibles, mais du coup c'est forcément réducteur et incomplet.

  • osvaldo piazzolla le 11/08/2016 à 00h52
    Oui le "duel", pas évident non plus. surtout que les quantifications individuelles défensives sont beuacoup plus complexes à définir et beaucoup moins évidentes à acquerir du sens que les quantifications offensives.

    Et le "xG" en tant que concept, c'est un des meilleurs candidats pour se rendre compte de l'absence d'universalité/reproductibilité/consensus/standardisation chez les données crées par des entreprises commerciales concurrentes.

    Mais ça le rend encore plus intéressant :)

  • sansai le 11/08/2016 à 05h13
    Je commente juste pour dire que j'ai rien à ajouter ni à retirer de cet article.

  • sansai le 11/08/2016 à 05h38
    Je m'y colle pour le dribble sinon : on pourrait dire que c'est un ensemble de maniements du ballon, en une ou plusieurs touches, qui fait appel à la dextérité et à la qualité des appuis au sol d'un joueur, et qui permet à ce joueur, quand il est sous pression d'un ou plusieurs adversaire(s) direct(s), d'éliminer ce ou ces adversaire(s) (éliminer un adversaire, ce serait s'ouvrir une ligne de passe, un espace dans lequel progresser balle au pied, ou une position de frappe, toujours "dans son dos" - vers son but).

    On pourrait même distinguer deux types de dribbles : le dribble de dégagement, apanage des joueurs les plus reculés, qui va utiliser l'élan d'un adversaire venu au pressing pour le prendre à contrepied et s'ouvrir l'espace dans son dos, et le dribble, heu, "d'attaquant" (j'ai pas mieux sous la langue là tout de suite) qui va permettre aux joueurs les plus avancés d'éliminer un défenseur bien en place.

    Mais il y aurait encore pas mal de choses à préciser dans toute cette terminologie.

  • osvaldo piazzolla le 11/08/2016 à 13h34
    j'aime bien tes définitions sansai, mais comment les transformer en des choses mesurables? (en tenant compte du fait qu'idéalement la mesure doit être automatisée et/ou gérable/reproductible par un mec sous payé qui regarde son dixième match de la journée)

  • sansai le 11/08/2016 à 16h31
    Ah oui, oui, mais c'est mon problème avec la data : le travail en amont pour définir de façon satisfaisante toutes les données du foot pour pouvoir les mathématiser me paraît absolument colossal (et infiniment loin d'être accompli jusqu'à présent).

    Sans compter qu'obtenir des consensus larges sur ces définitions va pas être évident du tout, du tout.

    Vous parlez (à juste titre) de la notion de "duel" avec Zlatanist, on a déjà un schisme béant entre pas mal d'entraîneurs qui vont accorder une grande importance au bilan brut des duels perdus (on le voit souvent en conférence de presse où un "mauvais" bilan dans les duels est régulièrement avancé comme une des causes de la défaite), et un Gourcuff, par exemple, pour qui la quantification des duels est une donnée négligeable en tant que telle (il émet l'idée qu'une succession de duels perdus à bon escient, qui va mener à une récupération du ballon collective, est un bilan positif, même si le bilan brut des duels est négatif - mais alors, c'est quoi un duel "bien perdu" ?).

    On peut se souvenir aussi des doutes très justes émis par Lizarazu dans le (bon) dossier de l'Equipe Explore sur la Data Revolution ( lien) sur l'influence que peut avoir la data sur le comportement des joueurs, qui vont éviter de prendre tel ou tel risque pour maintenir de "bonnes" stats (pourcentage de passes réussies, de duels gagnés), et ne pas prendre un risque qu'il aurait peut-être fallu prendre dans la passe, ne pas s'engager dans un duel risqué quand il aurait fallu qu'ils aillent disputer le ballon pour permettre à leur équipe de gagner du temps dans le replacement, etc, quand ils se savent observés.
    Comment on fait pour repérer le joueur qui "joue la stat" d'une part, de celui qui obtient les mêmes stats en jouant le jeu, en appliquant au mieux les consignes de son entraîneur ?

    Ah et puis tiens au passage, comment on fait pour distinguer les aptitudes/affinités d'un joueur avec le jeu de football, des tâches et des contraintes que lui impose son entraîneur ? Comment on quantifie la bonne application du plan de l'entraîneur et ce que ça coûte au joueur dans son expression individuelle ?

    De mon point de vue, tout en étant passionnants, les problèmes que soulèvent la data sont juste vertigineux, de la définition des "obtenues" aux consensus à établir sur l'importance de telle ou telle "obtenue", et je vois pas bien comment résoudre ça de façon satisfaisante avec des moyens comparables à ceux qui sont déployés aujourd'hui, avec tout ce que le foot a de secret (plans de l'entraîneur, ce qui se passe dans la tête des joueurs, etc).

    Je suis même à peu près convaincu qu'en l'état actuel des différentes écoles de pensée du football, il y a des consensus qui sont assez impossibles à obtenir.

La revue des Cahiers du football