Si vous saisissez votre mot de passe PUIS votre e-mail, vous aurez la confirmation que ça n'a aucun effet particulier. Attention à ne pas confondre vos minuscules et vos majuscules.
Vous avez oublié votre mot de passe ?
Inscription
Vous avez oublié votre mot de passe ? Il reste un espoir ! Saisissez votre adresse e-mail ; nous vous enverrons un nouveau mot de passe. Cette procédure est quasiment gratuite : elle ne vous coûtera qu'un clic humiliant.
Nous vous avons envoyé un email sur votre adresse, merci d'y jeter un oeil !

CONDITIONS D'INSCRIPTION :

1. Vous devez nous adresser, via le formulaire ci-dessous, un texte (format .txt inférieur à 100 ko) en rapport avec le football, dont la forme est libre : explication de votre passion, anecdote, aventure, souvenir, essai, commentaire composé, portrait, autobiographie, apologie, réquisitoire, etc. Vous serez ensuite informés de la validation de votre inscription par mail. Les meilleurs textes seront mis en ligne sur le Forum.

2. Nous ne disposons pas d'assez de temps pour justifier les retards d'inscription ou les non-inscriptions, et ne pouvons pas nous engager à suivre une éventuelle correspondance à ce sujet. Merci de votre compréhension.

Nous avons bien reçu votre candidature, on y jette un oeil dès que possible. Merci !

Partager :

Data et football : une relation en construction

Loin d'être à un niveau aussi avancé que dans certains sports américains où mesurer les données est facile, le ballon rond est encore analysé de manière superficielle. Les enjeux de la data sont pourtant grands.

Auteur : Osvaldo Piazzolla le 8 Août 2016

 

 

* * * Article initialement publié sur The Conversation * * *

 

Comment quantifier le foot? Toute tentative de définition, de production et d’organisation des données dans ce domaine suppose de répondre à quelques questions, par exemple: qu’est-ce qu’une passe, en football? On peut facilement imaginer qu’il y a une façon consensuelle de considérer qu’une passe est tentée, qu’une passe est réussie. Il est moins évident à définir qu’une passe est décisive (c’est-à-dire qu’elle entraîne un but). Jusqu’à ce que les ligues de football essayent d’harmoniser leurs définitions, les passes comptées comme "décisives" ici ne l’étaient pas forcément là.

 

En France, vous pouviez dribbler toute l’équipe adverse et faire une passe lumineuse qui ne laisse plus à l’attaquant qu’à pousser mollement le ballon aux fonds des filets: si jamais l’attaquant la contrôlait avant de marquer, alors votre passe n’était pas décisive. Alors qu’en Angleterre, vous pouviez passer dans votre propre surface un ballon approximatif de deux mètres à un partenaire qui s’en allait dribbler toute l’équipe adverse avant de marquer: vous étiez l’avant-dernière personne à avoir touché le ballon, votre passe était décisive. Deuxième question: qu’est ce qu’un centre? On imagine bien qu’il faut, pour qu’une passe soit considérée comme un centre, qu’elle parte d’une certaine zone sur les côtés du terrain, et arrive dans une autre. Mais quelle zone exactement?

 

Mint Digital/Flickr

 

 

Paramètres observables

Troisième question: qu’est-ce qu’un dribble? Tous ces concepts sont propres au football, ils sont aisément compris, discutés, évalués par des centaines de millions de gens qui s’intéressent au football dans le monde entier. Mais comment les transformer en paramètres observables, en "données" qui seront ensuite exploitées par des armées d’analystes ou de statisticiens? Comment définir "objectivement" (ou plutôt, pour ne pas employer de gros mots épistémiques, "de manière consensuelle") ce qu’est un dribble, et ce qu’est un dribble réussi, de manière à ce que cette définition produise un paramètre qui soit précis, mesurable, reproductible, et standardisé?

 

Ce n’est pas impossible, mais c’est loin d’être évident, d’autant plus que de nombreux analystes produisent des statistiques sur les joueurs ou les équipes qui dribblent le plus ou le mieux, sans pouvoir répondre à ces questions. Certains disent que la "donnée brute" est un oxymore, d’autres que la "donnée" est bien mal nommée et devrait s’appeler "obtenue". Ils veulent tous signifier qu’il est spécieux de faire des analyses quantitatives sans s’interroger d’où viennent les "données", en football comme ailleurs.

 

 

Choix de définitions

La "donnée" est d’abord pensée: imaginer un paramètre (la passe, le tir, l’expected goal, le ball movement point), c’est avoir une certaine idée de comment représenter le match (ou la saison), et le concept de ce paramètre est déjà une certaine vision du football, qui va être traduite et va performer. Définir la "donnée" n’est pas neutre non plus: définit-on le dribble topologiquement par un espace gagné balle au pied? Par des adversaires "éliminés"? Ces choix de définitions ne donneront pas la même valeur aux joueurs rapides et aux joueurs provocateurs.

 

Mesurer la donnée n’est pas non plus facile. Qui s’en charge? Des entreprises dont le business model est lié à une divulgation partielle de leurs méthodes (pour créer un produit d’appel) et un secret global (en situation concurrentielle). Avec quels choix techniques? La multiplicité de témoins humains enregistreurs? Ou bien fait-on appel à de la détection vidéo informatisée? Comment la reproductibilité est-elle gérée? Enfin, comment standardiser? Comment arriver à un consensus scientifique si la production de données provient d’entreprises concurrentes? Et comment ensuite les rendre intelligibles, accessibles, donc performatives?

 

Toutes ces questions ne signifient pas que ces méthodes sont illusoires et sans intérêt. Elles sont au contraire d’autant plus intéressantes! Au-delà d’une opposition naïve entre technophilie béate et technophobie grincheuse, toutes ces questions sont importantes à déconstruire dans toute tentative d’analyse de production scientifique, mais elles sont passionnantes dans le cas du football.

 

 

La donnée du foot au cœur de plusieurs industries

En effet, le football est au cœur d’enjeux économiques et culturels uniques. Ce sport, un peu comme la publicité, est une version caricaturale de notre société. Par exemple, observer ce qui se passe dans les tribunes des matches du Beitar Jérusalem en dit long sur l’agressivité de la société israélienne, mais comprendre les Ultras de l’Hapoël Tel-Aviv permet de le nuancer. Plus près de nous, les politiques de répression des ultras du foot en France sont, de l’aveu même des politiques, un laboratoire de la répression en général.

 

Pour rester dans notre sujet, la "donnée" dans le football est au cœur de plusieurs industries. Le marché du football lui-même (les transferts de joueurs, le marché des spectateurs…) n’en représente qu’une partie: d’un côté, l’industrie audiovisuelle est au cœur de ces enjeux par sa façon même de définir le spectacle qu’est le match de football télévisé. De l’autre (et non sans lien), l’industrie du pari sportif est structurellement liée à la quantification des probabilités et donc à l’utilisation industrielle de la donnée.

 

Le discours du besoin d’objectivité et de rationalité est typique d’un "régime de promesse technoscientifique". Comme pour les nanotechnologies par exemple, il s’agit de rendre inéluctable des choix techniques scientifiques et industriels. Mais la gouvernementalité de la donnée n’est pas le monopole d’un pouvoir unique, mais le lieu d’affrontements et d’intérêts divers et toutes ces questions scientifiques sont aussi des questions économiques, et politiques.

 

 

Maîtrise encore superficielle

Or le football, contrairement au baseball ou au basket-ball, par la nature même du jeu, se prête plus difficilement à la quantification. Il résiste à la donnée par sa complexité physique, tactique, stratégique et psychologique. Le domaine des football analytics est aujourd’hui dans un régime d’"adolescence" par rapport aux sports qui sont les success stories de la donnée, comme le baseball.

 

Quand un milliardaire américain achète le Liverpool FC, un des plus gros clubs de la planète, parce qu’il a été séduit par la success story hollywoodienne de Moneyball, il veut reproduire naïvement une belle histoire de baseball dans le football et son échec provoque les moqueries. Quand un entrepreneur dans l’industrie du pari sportif achète le Brentford FC, modeste club de Championship loin de l’actualité sportive internationale, les entremêlements entre le pari sportif, l’analyse de performance, le marché des joueurs sont à prendre au sérieux… pour comprendre comment se mettent en place les relations complexes entre "données" et football. Il s’agit de science, il s’agit d’économie, il s’agit de politique, il s’agit de culture.

 

Réactions

  • sansai le 11/08/2016 à 16h52
    Je peux continuer longtemps comme ça d'ailleurs : dans les "refus de jeu", j'ai aussi découvert la saison passée (avec Adryan à Nantes) un refus de jeu que je ne connaissais principalement que pour les défenseurs centraux et à la rigueur les 6 jusqu'à présent, celui de ne pas attaquer un espace libre balle au pied et de se débarrasser du ballon vers un partenaire plus avancé sans avoir fixé un adversaire au préalable.

    Et je vois pas non plus comment bien quantifier ces choses-là de manière automatisée, pourtant elles me paraissent cruciales dans l'analyse du jeu d'un joueur de foot.

    Quantifier le bon tempo d'une passe retardée suffisamment pour bien se caler sur le mouvement d'un partenaire par rapport à la défense adverse (et donc à la fois, repérer et quantifier les passes qui ne sont pas dans le bon tempo), on fait ça comment ? On entre dans des choses qui demandent une vision du jeu, qu'on peut avoir chez un observateur humain ; faire confiance à la vision du jeu d'un observateur expérimenté, c'est une chose, avec sa part de déchet et de pifomètre assumée, mais traduire ça en mesures mathématiques fiables, ça devient une toute autre histoire, mais de façon exponentielle.

    Et le problème de la main d'oeuvre sous-payée pour la collecte des données est bel et bien là : t'auras pas une observation de qualité en déployant des milliers de précaires sous-formés (y compris, sous-formés à l'école de pensée du client à qui tu destines tes data, et qui donc ne vont pas forcément comptabiliser de la bonne manière ce qui l'intéresse).

    Moi ça me file un peu le tournis d'essayer d'imaginer une résolution satisfaisante de cette collecte de données, même en essayant d'imaginer des moyens audiovisuels et informatiques de lecture et d'analyse automatisée du jeu. Ça paraît tellement loin tout ça.

    Et c'est pas mal ce qui me gêne dans cet engouement autour de la data qui manque pas mal de recul critique, alors que de toute évidence elle est pour l'heure éminemment critiquable et insatisfaisante dès qu'on prend 5 minutes pour la questionner un peu.

  • osvaldo piazzolla le 12/08/2016 à 14h16
    merci Sansai pour la disser... le comm.

    Tous les points que tu soulèves sont des super exemples et en particulier une de très grandes difficultés est sûrement la question de l'utilité collective de données individuelles et/ou la définition de paramètres sensés traduire le collectif.

    D'un point de vue prospectif, je ne crois pas que l'immensité de la tâche fasse peur. Il y a un côté pragmatique "si quelque chose marche c'est déjà pas mal" : Il est assez frappant que, bien qu les enjeux financiaro industriels du pari sont énormes (et secrets), l'innovation dans ce domaine vient souvent d'amateurs , particulièrtment de blogueurs, et le débauchage de blogueurs par les opta/prozone/clubs (et la subsequente privatisation de concepts initialemnt ouverts) est symptomatique d'un économie prête à tout essayer.

La revue des Cahiers du football