En vous connectant, vous certifiez n'avoir jamais trompé votre club favori. Attention à ne pas confondre vos minuscules et vos majuscules.
Vous avez oublié votre mot de passe ?
Inscription
Vous avez oublié votre mot de passe ? Il reste un espoir ! Saisissez votre adresse e-mail ; nous vous enverrons un nouveau mot de passe. Cette procédure est quasiment gratuite : elle ne vous coûtera qu'un clic humiliant.
Nous vous avons envoyé un email sur votre adresse, merci d'y jeter un oeil !

CONDITIONS D'INSCRIPTION :

1. Vous devez nous adresser, via le formulaire ci-dessous, un texte (format .txt inférieur à 100 ko) en rapport avec le football, dont la forme est libre : explication de votre passion, anecdote, aventure, souvenir, essai, commentaire composé, portrait, autobiographie, apologie, réquisitoire, etc. Vous serez ensuite informés de la validation de votre inscription par mail. Les meilleurs textes seront mis en ligne sur le Forum.

2. Nous ne disposons pas d'assez de temps pour justifier les retards d'inscription ou les non-inscriptions, et ne pouvons pas nous engager à suivre une éventuelle correspondance à ce sujet. Merci de votre compréhension.

Nous avons bien reçu votre candidature, on y jette un oeil dès que possible. Merci !

Partager :

Data et football : une relation en construction

Loin d'être à un niveau aussi avancé que dans certains sports américains où mesurer les données est facile, le ballon rond est encore analysé de manière superficielle. Les enjeux de la data sont pourtant grands.

Auteur : Osvaldo Piazzolla le 8 Août 2016

 

 

* * * Article initialement publié sur The Conversation * * *

 

Comment quantifier le foot? Toute tentative de définition, de production et d’organisation des données dans ce domaine suppose de répondre à quelques questions, par exemple: qu’est-ce qu’une passe, en football? On peut facilement imaginer qu’il y a une façon consensuelle de considérer qu’une passe est tentée, qu’une passe est réussie. Il est moins évident à définir qu’une passe est décisive (c’est-à-dire qu’elle entraîne un but). Jusqu’à ce que les ligues de football essayent d’harmoniser leurs définitions, les passes comptées comme "décisives" ici ne l’étaient pas forcément là.

 

En France, vous pouviez dribbler toute l’équipe adverse et faire une passe lumineuse qui ne laisse plus à l’attaquant qu’à pousser mollement le ballon aux fonds des filets: si jamais l’attaquant la contrôlait avant de marquer, alors votre passe n’était pas décisive. Alors qu’en Angleterre, vous pouviez passer dans votre propre surface un ballon approximatif de deux mètres à un partenaire qui s’en allait dribbler toute l’équipe adverse avant de marquer: vous étiez l’avant-dernière personne à avoir touché le ballon, votre passe était décisive. Deuxième question: qu’est ce qu’un centre? On imagine bien qu’il faut, pour qu’une passe soit considérée comme un centre, qu’elle parte d’une certaine zone sur les côtés du terrain, et arrive dans une autre. Mais quelle zone exactement?

 

Mint Digital/Flickr

 

 

Paramètres observables

Troisième question: qu’est-ce qu’un dribble? Tous ces concepts sont propres au football, ils sont aisément compris, discutés, évalués par des centaines de millions de gens qui s’intéressent au football dans le monde entier. Mais comment les transformer en paramètres observables, en "données" qui seront ensuite exploitées par des armées d’analystes ou de statisticiens? Comment définir "objectivement" (ou plutôt, pour ne pas employer de gros mots épistémiques, "de manière consensuelle") ce qu’est un dribble, et ce qu’est un dribble réussi, de manière à ce que cette définition produise un paramètre qui soit précis, mesurable, reproductible, et standardisé?

 

Ce n’est pas impossible, mais c’est loin d’être évident, d’autant plus que de nombreux analystes produisent des statistiques sur les joueurs ou les équipes qui dribblent le plus ou le mieux, sans pouvoir répondre à ces questions. Certains disent que la "donnée brute" est un oxymore, d’autres que la "donnée" est bien mal nommée et devrait s’appeler "obtenue". Ils veulent tous signifier qu’il est spécieux de faire des analyses quantitatives sans s’interroger d’où viennent les "données", en football comme ailleurs.

 

 

Choix de définitions

La "donnée" est d’abord pensée: imaginer un paramètre (la passe, le tir, l’expected goal, le ball movement point), c’est avoir une certaine idée de comment représenter le match (ou la saison), et le concept de ce paramètre est déjà une certaine vision du football, qui va être traduite et va performer. Définir la "donnée" n’est pas neutre non plus: définit-on le dribble topologiquement par un espace gagné balle au pied? Par des adversaires "éliminés"? Ces choix de définitions ne donneront pas la même valeur aux joueurs rapides et aux joueurs provocateurs.

 

Mesurer la donnée n’est pas non plus facile. Qui s’en charge? Des entreprises dont le business model est lié à une divulgation partielle de leurs méthodes (pour créer un produit d’appel) et un secret global (en situation concurrentielle). Avec quels choix techniques? La multiplicité de témoins humains enregistreurs? Ou bien fait-on appel à de la détection vidéo informatisée? Comment la reproductibilité est-elle gérée? Enfin, comment standardiser? Comment arriver à un consensus scientifique si la production de données provient d’entreprises concurrentes? Et comment ensuite les rendre intelligibles, accessibles, donc performatives?

 

Toutes ces questions ne signifient pas que ces méthodes sont illusoires et sans intérêt. Elles sont au contraire d’autant plus intéressantes! Au-delà d’une opposition naïve entre technophilie béate et technophobie grincheuse, toutes ces questions sont importantes à déconstruire dans toute tentative d’analyse de production scientifique, mais elles sont passionnantes dans le cas du football.

 

 

La donnée du foot au cœur de plusieurs industries

En effet, le football est au cœur d’enjeux économiques et culturels uniques. Ce sport, un peu comme la publicité, est une version caricaturale de notre société. Par exemple, observer ce qui se passe dans les tribunes des matches du Beitar Jérusalem en dit long sur l’agressivité de la société israélienne, mais comprendre les Ultras de l’Hapoël Tel-Aviv permet de le nuancer. Plus près de nous, les politiques de répression des ultras du foot en France sont, de l’aveu même des politiques, un laboratoire de la répression en général.

 

Pour rester dans notre sujet, la "donnée" dans le football est au cœur de plusieurs industries. Le marché du football lui-même (les transferts de joueurs, le marché des spectateurs…) n’en représente qu’une partie: d’un côté, l’industrie audiovisuelle est au cœur de ces enjeux par sa façon même de définir le spectacle qu’est le match de football télévisé. De l’autre (et non sans lien), l’industrie du pari sportif est structurellement liée à la quantification des probabilités et donc à l’utilisation industrielle de la donnée.

 

Le discours du besoin d’objectivité et de rationalité est typique d’un "régime de promesse technoscientifique". Comme pour les nanotechnologies par exemple, il s’agit de rendre inéluctable des choix techniques scientifiques et industriels. Mais la gouvernementalité de la donnée n’est pas le monopole d’un pouvoir unique, mais le lieu d’affrontements et d’intérêts divers et toutes ces questions scientifiques sont aussi des questions économiques, et politiques.

 

 

Maîtrise encore superficielle

Or le football, contrairement au baseball ou au basket-ball, par la nature même du jeu, se prête plus difficilement à la quantification. Il résiste à la donnée par sa complexité physique, tactique, stratégique et psychologique. Le domaine des football analytics est aujourd’hui dans un régime d’"adolescence" par rapport aux sports qui sont les success stories de la donnée, comme le baseball.

 

Quand un milliardaire américain achète le Liverpool FC, un des plus gros clubs de la planète, parce qu’il a été séduit par la success story hollywoodienne de Moneyball, il veut reproduire naïvement une belle histoire de baseball dans le football et son échec provoque les moqueries. Quand un entrepreneur dans l’industrie du pari sportif achète le Brentford FC, modeste club de Championship loin de l’actualité sportive internationale, les entremêlements entre le pari sportif, l’analyse de performance, le marché des joueurs sont à prendre au sérieux… pour comprendre comment se mettent en place les relations complexes entre "données" et football. Il s’agit de science, il s’agit d’économie, il s’agit de politique, il s’agit de culture.

 

Réactions

  • osvaldo piazzolla le 08/08/2016 à 13h57
    bouh. Personne commente mon article hyper polémique.

  • Khalil Gibran le 08/08/2016 à 14h07
    Ceci n'est pas un commentaire.

  • José-Mickaël le 08/08/2016 à 18h48
    Voici un non-commentaire polémique : j'ai arrêté de lire l'article à la phrase « Les enjeux de la data sont pourtant grands » parce que je déteste ce mot « data », qui signifie « données ». Je suis sûr qu'il existe une expression correcte en français (statistiques ? analyse de données ? autres ?) et j'aimerais qu'elle soit employée. Mais bon, il y a des effets de mode, dommage de les suivre...

    (Mais je suis conscient d'être maniaque.)

  • osvaldo piazzolla le 08/08/2016 à 19h14
    Tu es dur, parce que ce n'est pas moi qui ai écrit le chapô, et que dans le corps du texte il n'y a pas une seule fois le mot "data".

    Mais au delà de la question de l'anglicisme, tout une partie de l'article concerne justement le fait que le mot "donnée" (et en anglais, en latin et en français c'est pareil) est un oxymore à lui tout seul.

    C'est même la thèse de l'article que la question de la "donnée" qui n'est pas donnée est essentielle et n'est pas comprise par ceux qui font des "statistiques" ou des "analyses".

    en ce sens, le titre (et le chapô) est excellent, parce que le mot clef sur lequel il faut porter son attention ce n'est pas "donnée", c'est CONSTRUCTION.

  • José-Mickaël le 08/08/2016 à 19h33
    osvaldo piazzolla
    aujourd'hui à 19h14
    > Tu es dur, parce que ce n'est pas moi qui ai écrit le chapô, et que dans le corps du texte il n'y a pas une seule fois le mot "data".

    Ah, mais du coup c'est trompeur ! Du coup je vais lire l'article, merci pour la mise au point.

  • José-Mickaël le 08/08/2016 à 20h23
    Re. Finalement je dois m'excuser platement : tu av

  • José-Mickaël le 08/08/2016 à 20h25
    tu avais, en effet, fait l'effort d'écrire en français.

    Sinon, je n'ai pas de commentaire particulier sur l'article, qui ne me semble pas spécialement polémique. En tout cas j'ai l'impression qu'il pose de bonnes questions.

  • osvaldo piazzolla le 08/08/2016 à 20h45
    hi hi oui, j'ai mis le mot "polémique" pour faire du buzz (shame). Mais ce que j'aimerais provoquer comme réaction, c'est que les gens essayent d'imaginer comment on définit un dribble par exemple. A chaque fois que je pose la question, je ne reçois que des haussements d'épaules. le dribble me semble être un bon exempe parce qu'il est culturellement très facile à identifier mais à définir opérationnellement, ça me semble une autre paire de manches.

  • lunatic XV le 09/08/2016 à 13h36
    Pour moi qui suis assidûment le baseball US, c'est sûr que le cadre de jeu est tellement plus libre en foot que cela nuit à des mesures "objectives" et renforce l'importance du consensus pour parler stats, une fois évacués les aspects vitesse (de course, de tir) et positionnement (tir hors/dans la surface). Et que, oui c'est dur d'arriver à ce consensus sur les "informations de base" à recenser et analyser. Ceci étant dit, rien que les mesures disons "géographiques" (type heatmap, cartographie de passes, schémas préférentiels) présentent un grand intérêt. Le reste a de beaux jours devant lui - et gardons en tête que même au baseball, il n'y a pas de consensus sur l'analyse des faits de base, pas mal de formules sont en concurrence. C'est seulement qu'ils ont quelques années de maturité en plus sur le sujet... bref: ne desesperons pas du futur !

  • osvaldo piazzolla le 09/08/2016 à 16h48
    Il est certain que certains sports se prêtent plus à la quantification que d'autres. En termes d'influence des chiffres, c'est 1.Baseball 2.Basket 3.Toutlereste (c'est la catégorisation officielle de la sloan conference)

    Mais mon point, c'est aussi de dire que la définition même des données (et les définitions de leurs représentations) traduit une certaine vision du sport et la rend performative (avant même que se posent les questions de reproductibilité/stanrdadisation/consensus)

    Un exemple simple : Dans les heat maps les permutations d'ailiers sont invisibilisées.