auteur
Philippe Gargov

Prospective tactique sur football totalitaire. Sur le banc des Dé-Managers.

 

@footalitaire


Du même auteur

Us et abus de la data

L'utilisation de plus en plus systématique de la statistique dans les analyses divise. Mais celle-ci, loin d'avoir la prétention qu'on lui accorde, souffre plus des interprétations qu'on fait d'elle que de ses propres limites.


Jeff Tran Hui

11/03/2015 à 09h49

Comme pour tout, l'excès tue.

Zorro et Zlatan fouillent aux fiches

11/03/2015 à 10h56

Travaillant depuis un bout de temps dans la "Big Data", ca fait maintenant quelques années que ce recours systématique aux données dans les médias (sportifs mais pas que) me met mal à l'aise. C'est un outil que peu de gens savent vraiment utiliser. Il ne s'agit pas seulement d'extraire des statistiques, mais de leur donner du sens - mettre en évidence le lien entre simple corrélation et causalité. On en est loin. Les chiffres, data-visualisations et autres infographies employés à tort et à travers (et les cahiers et les dé-managers ne sont pas complètement étrangers à la pratique) n'ont de sens que s'ils sont statistiquement significatifs et que leur lien de cause à effet avec le sujet abordé est clair (mauvais exemples : http://www.cahiersdufootball.com/article-dans-les-cartons-des-de-managers-42-5605 ou http://www.cahiersdufootball.com/article-dans-les-cartons-des-de-managers-44-5626). Le problème, c'est qu'on a l'impression d'être dans un schéma inversé où on cherche une corrélation qui colle avec un thème pris au hasard. Par exemple je veux analyser les résultats des gigis. Il se trouve (vérifiez pas) que ces rêsultats sont corrélés aux volumes de Cacolac vendus à Clermont-Ferrand. N'importe quelle personne sensée ne va pas mettre en avant un lien de cause à effet entre les deux parce que ca n'a pas de lien logique. Ok, mais on voit l'inverse tout le temps, c'est-à-dire une corrélation sur un thème proche qui suggère un lien, d'où l'analyste conclut la causalité. Au foot ca veut dire n'importe quoi, nombre de brins d'herbes dans la surface vs buts marqués. Le problème c'est que ces données ne sont qu'extrêment rarement significatives - on s'intéresse à 20 équipes sur une vingtaine de journées, aux nombres de buts d'une équipe sur une saison. Mais on fait l'impasse sur ce détail parce que la causalité suggérée est forte, puisqu'on est dans un contexte limité. C'est une évidence, tout le monde va me dire qu'on sait bien que corrélation n'est pas causalité ; et pourtant on continue à servir ces infographies sans jamais tenter de prouver ce lien entre les deux. Si on utilise des méthodes scientifiques pour étayer son argumentaire, on se doit d'en respected les règles et produire les éléments qui valident la théorie donnée (p-value ou que sais-je).

leo

11/03/2015 à 11h05

J'ajoute au propos de Zorro et Zlatan que les stats "avancées" ont vu le jour au baseball, sport sport presque diamétralement opposé du football : phases de jeu très facilement quantifiables, beaucoup plus grande répétabilité, échantillon immensément plus grand (162 matchs par saison en MLB, près de 200000 passage à la batte par saison...). L'extension de ce genre de statistiques à un sport beaucoup plus dynamique comme le football me semble toujours hasardeux.

Sens de la dérision

11/03/2015 à 11h15

Je suis d'accord avec Zorro et Zlatan. Le problème ce n'est pas la statistique (d'ailleurs perso j'utilise plus souvent le terme "les statistiques" que "la statistique", je suis sûr qu'il y a à creuser dans la différence d'appellation). Le problème donc n'est pas la statistique mais la façon de l'appliquer. Et j'enrage de voir écrit "il y a une différence" sans aucune preuve mathématique qu'une moyenne différente, idem pour la corrélation... La statistique se résume à des chiffres balancés par des gens qui connaissent encore moins les stats que moins.

Jizzkov

11/03/2015 à 11h16

Sens de la dérision aujourd'hui à 11h15 Je suis d'accord avec Zorro et Zlatan. Le problème donc n'est pas la statistique mais la façon de l'appliquer. - Oui, c'est exactement le sens du papier.

Lionel Joserien

11/03/2015 à 11h20

Article fort intéressant. Je me permets quelques précisions et pinaillages : - les statistiques quarternaires ne sont à mon sens balbutiantes que dans les médias. Au niveau des clubs (et des chercheurs) elles sont massivement utilisées depuis maintes années. Par exemple : le nombre et l'intensité des sprints etc... Ces stats sont loin d'avoir pour seul source les gps, des caméras ultra-sophistiquées permettent de suivre les mouvements de chaque joueur sur le terrain. - le déficit de notoriété de Prozone se justifie par le fait que cette société était connu en France sous le nom d'Amisco, les deux boites ont fusionné. Pour les personnes intéressées par le sujet, Grantland est une mine d'or.

Jizzkov

11/03/2015 à 11h28

Lionel Joserien aujourd'hui à 11h20 Article fort intéressant. Je me permets quelques précisions et pinaillages : - Très bons commentaires, je vais éditer le texte en fonction ! Pour le premier, je faisais évidemment référence au paysage médiatique uniquement, tu as raison de le préciser. Pour le second, je t'avoue que je n'avais pas tilté ; il me semble aussi qu'Amisco-Prozone est davantage tourné vers les clubs ?

Zorro et Zlatan fouillent aux fiches

11/03/2015 à 12h39

Jizzkov aujourd'hui à 11h16 Sens de la dérision aujourd'hui à 11h15 Je suis d'accord avec Zorro et Zlatan. Le problème donc n'est pas la statistique mais la façon de l'appliquer. - Oui, c'est exactement le sens du papier. --- Oui, enfin l'article met en avant la contextualisation et l'analyse mais fait l'impasse sur la nécessité d'établir la dépendance entre plusieurs paramètres observés. Comparer les 78 passes d'un joueur au nombre de passes moyen des joueurs à ce poste c'est un exercice vide de sens si on ne le relie pas à autre chose. En filigrane de cette comparaison, on comprend que ce nombre de passes peut avoir une influence (positive ou négative) sur le jeu. Mais comment mesurer cette influence ? En l'occurrence on se contente de se fier à l'avis de l'expert, mais, non ce n'est pas suffisant. Il faut d'abord démontrer que cette influence existe sans quoi on fait de la pseudo-science. Ca reste de l'enrobage d'analyse, pas de l'étayage. Je reviens sur ce graphique : http://www.cahiersdufootball.com/images-article/images2/file/cartons-infographie-distance-FULL.jpg On y parle de corrélation et on y suggère un lien de causalité. Mais l'expertise de l'analyste ne suffit pas à démontrer cette causalité, pas tant que la corrélation n'a pas été établie, ce qui demande un échantillon significatif.

Valbuena Jacta Est

11/03/2015 à 13h44

Très intéressant. Ce qui m'agace également c'est l'amalgame entre données et statistiques. Techniquement, présenter des positions moyennes, des chiffres descriptifs, ce n'est qu'une infime (et réductrice) partie de ce que sont les stats. Et justement, le reste des statistiques (99% du domaine quoi) consiste à trouver du sens dans les données. Mettre en lumière des corrélations, par exemple, comme le présente Z et Z. Bref, à mon sens le problème vient du fait que le message actuel est surtout "on vous montre plein de chiffres" uniquement. Sous-entendu, à vous d'en faire sens. La (vraie) statistique, c'est déjà un premier pas vers l'interprétation et non la simple description.

Lionel Joserien

11/03/2015 à 14h02

Jizzkov aujourd'hui à 11h28 --- A ma connaissance, c'est bien ça. Bien que Prozone / Amisco bosse également pour des fédérations et médias (dont Canal+). ---- Valbuena Jacta Est aujourd'hui à 13h44 --- C'est mon sentiment également : on balance des chiffres comme quand on balance des systèmes de jeu. Pour moi asséner "ils ont réalisé 302 passes" équivaut au fameux "ils jouent en 4-4-2" comme si ça disait tout sur la manière de jouer d'une équipe. --- Je fondais un gros espoir sur Dataroom, grosse déception, j'attendais autre chose que la comparaison du nombre de buts par match pour déterminer qui était le meilleur attaquant du monde (je caricature à peine).

 

Zlatanist

11/03/2015 à 14h15

Lionel Joserien aujourd'hui à 11h20 Tu peux préciser pour Grantland? Je vois que ça parle de Sports US, parfois avec de la stat, mais rien vu de particulier sur le sujet de la récolte de données pour le sport. En parlant des données quaternaires, beaucoup de clubs utilisent aussi (même à des échelons assez bas) des capteurs de rythme cardiaques afin de mesurer l'intensité du travail effectué, sur le terrain à l'entraînement ou à la salle de sport en solo. Quant à équiper les joueurs de L1 de GPS, ce n'est pas la peine puisque les déplacements sont déjà évalués à l'aide d'outils d'analyse vidéo, ce qui permet entre autres de connaître la distance parcourue par chaque joueur.

Les brèves

Je crois que bon bon

"Laurent Blanc à Lyon, ça ne colle pas pour deux raisons" (foot01.com)

Aucun

"Euro U17 : qui sont les joueurs majeurs de l'équipe de France ?"

Autobiographie

"Ribéry : Des débuts fracassants." (lequipe.fr)

Ô Pep !

"Un pays africain rêve de Bruno Genesio !" (dailymercato.com)

Ruuuuuuuuuuuuuuuuuuud van Nistelrooy

"PSV Eindhoven : Ruud van Nistelrooy prolonge sur le banc des U19." (lequipe.fr)