Passer aux stats supérieures
Les statistiques ou \"data\" sont en vogue, mais il est temps de leur donner un autre statut que celui de gadget ou de caution pour médias en mal de les exploiter...
Philippe Gargov fait de la prospective, ici sur la ville, et là sur le foot, il est l'auteur sur ces pages de "Guardiola, le football sans attaquant".
Avec la légalisation des paris sportifs en ligne, les statistiques footballistiques sont devenue en quelques années une composante essentielle du traitement médiatique du ballon rond... au point de prévaloir sur celui du jeu lui-même. Cette tendance ne concerne pas que le football, mais reflète plus largement la gadgétisation des “data” dans notre société abreuvée de chiffres qu’elle ne maîtrise pas forcément. Pratique populaire, le foot a aujourd’hui l’occasion de prendre le contre-pied de cette tendance risible, et ainsi servir de base à une véritable pédagogie de la data chez les spectateurs.
Petit précis de la data footballistique
Il existe différents modes d’utilisation des données dans le football, et le sport en général. La première, assez récente mais sans doute la plus légitime, consiste à accumuler un ensemble de données sur les performances des joueurs, grâce aux nouvelles technologies, afin d’améliorer leur “rendement” en situation de match. L’utilisation de GPS à l’entraînement de l’AS Saint-Étienne et surtout du Paris Saint-Germain, présentée en grande pompe pour souligner l’arrivée de Carlo Ancelotti aux commandes du club, témoigne ainsi d’une logique statisticienne encore inhabituelle en France.
Si cette perspective très comptable prête le flanc aux critiques, elle n’en représente pas moins une évolution naturelle du sport et du foot en particulier. Sa professionnalisation extrême implique une gestion optimale des ressources (les joueurs) qui amène les entreprises-clubs à se doter d’outils de mesure toujours plus sophistiqués, comme ce cardio-fréquencemètre développé pour le basket américain ou cette application iPad permettant aux entraîneurs de recueillir eux-mêmes des données sur leur équipe.
La seconde utilisation est tout aussi naturelle, mais connaît certaines dérives récentes. Depuis longtemps, le traitement médiatique des données permet d’enrichir la représentation du match en informant le spectateur sur le contexte du match, tant dans son environnement que dans sa composition (âge moyen des joueurs ou poids cumulé d’un pack en rugby, par exemple). Souvent accessoire, cet usage traditionnel est concurrencé depuis peu par une excroissance plus insidieuse: à l’instar de la politique ou de l’économie, le football n’a en effet pas échappé à la “gadgétisation” intensive de la data. Il est même l’un des laboratoires les plus significatifs des dérives engendrées par cette “infobésité” absconse, voire absurde... Un véritable contre-manuel du datajournalisme.
Usages et mésusages de la statistique
Cette tendance s’incarne principalement dans l’arrivée récente d’acteurs majeurs de la data dans la sphère médiatique, comme par exemple l’agence britannique Opta. Le blog Plat du pied rendait compte de l’arrivée de ce nouvel acteur en France dans un article au titre évocateur, “Les joueurs de foot sont des statistiques comme les autres”. Mais c’est surtout dans leur mésusage par la sphère médiatique que cet essor des statistiques révèle toutes ses nuisances; en ce sens, les agences statistiques n’ont qu’une responsabilité relative dans les dérives observées, et dénoncées ici.
Avec l’arrivée d’Opta en France, les principaux médias sportifs se sont engouffrés dans la survalorisation de datas, là où celles-ci n’occupaient auparavant qu’un espace relativement accessoire. Les données s’affranchissent même parfois de ces supports médiatiques, à l’image de l’application de data-visualisation proposée par Intel.
On ne compte plus les infographies, se voulant “révélatrices” car s’appuyant sur des données “objectives”, affichées sans plus de commentaires que les chiffres assénés. Exemple avec ce comparatif des deux attaquants “concurrents” en équipe de France, Kevin Gameiro et Olivier Giroud. Une comparaison absurde, tant sur le fond (les joueurs ont un profil diamétralement opposé) que sur la forme (temps de jeu non significatifs, en particulier sur les matches amicaux mesurés)... mais une comparaison qui fait vendre, les joueurs étant de surcroît opposés en championnat.
La footballogie, nouvelle plaie médiatique
Jetées en pâture aux lecteurs sans plus de mises en perspective, ces statistiques ne servent en réalité qu’à légitimer le discours des journalistes ou consultants qui les portent. On retrouve là une logique autoréalisatrice bien connue des amateurs (et détracteurs) de sondages politiques, qui n’ont pour seul intérêt que de crédibiliser la parole d’intervenants en résidence médiatique. Toujours dans cette logique performative, le consultant n’hésitera pas à constamment rappeler son objectivité nécessairement irréfutable (à l’image de l’auto-proclamé “footballogue” Geoffroy Garétier lorsqu’il déclare : “Je savais que l'OM éliminerait l'Inter. C'est aisément vérifiable. Je ne suis pas devin. Les faits, rien que les faits”). Le consultant statisticien oublie au passage les enseignements de Karl Popper sur la nécessaire réfutabilité des sciences, qui les distinguent justement des pseudo-sciences dont la footballogie semble le dernier avatar médiatique.
Pire, cette survalorisation des data finit par supplanter l’essentiel, à savoir le jeu et son analyse. On en vient d’ailleurs à confondre le rôle de journaliste sportif et celui de consultant – dès lors légitimé par la data. On retrouve ici la prolongation d’une tendance imposante du sport professionnel, et du foot en particulier, largement commentée par Jacques Blociszewski, chercheur et auteur de Le Match de football télévisé (2007). Si son propos concerne principalement les technologies de visualisation utilisées pour décortiquer une action de jeu, il s’applique mot pour mot à l’essor des statistiques: “La réalisation télévisuelle des matches obéit à des logiques qui n'ont pas grand chose à voir avec le sport lui-même [...] Malgré le prestige (irraisonné) dont jouissent les technologies, ce fonctionnement soulève beaucoup d'interrogations.”
Une autre statistique est possible !
Il ne faut pas pour autant jeter la data avec l’eau du grand bain médiatique. La data n’est pas en cause, mais l’usage qu’en font d’apprentis sorciers prêt à tout pour asseoir leur place sur un plateau. Or, d’autres voies existent. La première consiste en une simple mise en perspective de la donnée par de véritables analyses de fond, notamment sur le plan tactique. En politique comme en socio-économie, certains ont déjà prouvé leur capacité à prendre du recul sur un chiffre déblatéré à l’antenne, pour tenter de l’expliciter aux téléspectateurs (dans une posture d’objectivité volontiers critiquable). C’est ce que tente par exemple Eurosport.fr, avec des articles sommairement introduits ainsi: “L’analyse statistique montre que”. On pourra toutefois regretter la faiblesse des textes proposés, tant sur le fond que sur la forme - quelques lignes seulement. En cause, la faiblesse des data utilisées, puisqu’il s’agit encore et toujours des poncifs du genre: possession de balle, nombre de tirs, etc.
Il faut sortir de l’Hexagone pour trouver une véritable analyse intelligente et approfondie des statistiques, auprès de consultants reconnus tels que Michael Fox, créateur de Zonal Marking. Sur ce blog de tactique, la data n’a que fonction d’outil pour décrypter le jeu d’une équipe (l’APOEL Nicosie ou le Rayo Vallecano), l’évolution des pratiques footballistiques (le rôle du gardien de but dans l'animation du ballon), voire celle d’un championnat (géographie des attaques en première ligue anglaise). On notera au passage quelques propositions à la fois simples et innovantes, en termes de visualisation, bien loin des tableaux de chiffres utilisés par les journalistes pour vendre une confrontation à venir. En réalité, le bon usage vient – comme souvent – d’acteurs tiers qui n’ont rien à en tirer, sinon l’envie de bien faire et un peu de postérité.
Pour un Open Data du ballon rond
On rejoint ici une problématique bien connue des cultures numériques, et de la data en particulier: l’innovation ne peut être qu’ascendante, portée par des individus et entrepreneurs tiers n’étant pas impliqués dans les processus de gouvernance concernés (ici, la représentation télévisuelle du match et donc les revenus publicitaires). Pourquoi cette culture du bidouillage amateur devrait-elle se cantonner aux sujets sérieux de la politique, de l’économie ou des institutions publiques (avec l’open data, l’ouverture des données publiques)? Parce qu’il est le sport populaire par excellence, le football mériterait qu’on le traite comme un objet culturel à part entière, plutôt que de le laisser à la merci des chaînes de télévisions et autres opérateurs numériques. Il apparaît dès lors nécessaire d’ouvrir ces bases de données footballistiques au grand public.
Certains l’ont bien compris, même si cela reste pour l’instant balbutiant. Aussi FootyTube, site de traitement de l’après-match a-t-il mis ses diverses API en libre accès soumis à condition, afin que les développeurs puissent créer leurs propres applications. Si celles-ci ne donnent pour l’instant accès qu’à des jeux de données relativement peu intéressantes, on peut imaginer à terme d’autres bases plus qualitatives qui permettent des visualisations véritablement pertinentes des enjeux d’un match.
C’est notamment le cas de l’application StatsZone, proposée par FourFourTwo en partenariat avec Opta. L’app donne ainsi accès à une pluralité de données permettant de créer ses propres visualisations du jeu (direction des passes réussies dans le camp adverse, par exemple). Malheureusement, l’application n’échappe pas aux réalités financières et n’est gratuite que pour le championnat anglais. De surcroît, il serait bien plus pertinent de proposer des APIs plutôt qu’une application dédiée, afin de véritablement favoriser l’essaimage de l’innovation.
Si l’on souhaite rendre au sport ses lettres de noblesse, et lui confier ce rôle pédagogique qu’on lui prête souvent, il convient de le retirer en partie des mains qui l’agitent aujourd’hui comme un jouet lucratif. Cela passe entre autres par une ouverture des données statistiques qui pourrait, par son ampleur, servir de catalyseur dans d’autres domaines. Cette tendance, qui balbutie aujourd’hui dans le foot, pourrait ainsi servir à impulser une démocratisation plus large de la connaissance statistique, afin de lutter contre “l’anarithmétisme” qui touche une large partie de la population. Avec, en ligne de mire, la construction d’une véritable culture de l’intelligence footballistique – histoire que ces derniers mots ne soient plus l’oxymore qu’ils sont encore trop souvent?
Note : ce texte fait suite à une récente session de l’émission Place de la Toile (podcast disponible), justement consacrée aux statistiques dans le football moderne, et dans laquelle intervenaient Jérôme Latta, David Collet (Opta France) et l’auteur. Merci à Sabine et Guillaume (Owni.fr) pour leur participation active à ce texte.