Ne perdez pas de temps à lire ce texte, connectez-vous vite pour commenter les articles des CDF. Attention à ne pas confondre vos minuscules et vos majuscules.
Vous avez oublié votre mot de passe ?
Inscription
Vous avez oublié votre mot de passe ? Il reste un espoir ! Saisissez votre adresse e-mail ; nous vous enverrons un nouveau mot de passe. Cette procédure est quasiment gratuite : elle ne vous coûtera qu'un clic humiliant.
Nous vous avons envoyé un email sur votre adresse, merci d'y jeter un oeil !

CONDITIONS D'INSCRIPTION :

1. Vous devez nous adresser, via le formulaire ci-dessous, un texte (format .txt inférieur à 100 ko) en rapport avec le football, dont la forme est libre : explication de votre passion, anecdote, aventure, souvenir, essai, commentaire composé, portrait, autobiographie, apologie, réquisitoire, etc. Vous serez ensuite informés de la validation de votre inscription par mail. Les meilleurs textes seront mis en ligne sur le Forum.

2. Nous ne disposons pas d'assez de temps pour justifier les retards d'inscription ou les non-inscriptions, et ne pouvons pas nous engager à suivre une éventuelle correspondance à ce sujet. Merci de votre compréhension.

Nous avons bien reçu votre candidature, on y jette un oeil dès que possible. Merci !

Partager :

Pourquoi Paris a une chance sur deux de se qualifier

Ici maintenant, la démonstration mathématique que le FC Barcelone arrive tout juste à 50% de chance de qualification.

Auteur : Gilles Juan le 8 Avr 2013

 


En coupe d'Europe, après avoir concédé le score 2-2 à domicile, seules 37 équipes sur 191 [1]  se sont finalement qualifiées. À partir de là, on estime que le PSG a donc 19,4% de chances de se qualifier. Mais qu’est-ce que cela signifie?
 


Cela signifie qu’il faut se méfier des statistiques

En Ligue des champions, aucun club ne s’était qualifié après avoir perdu 2-0 à l’extérieur au match aller. Avant même que le match retour n’ait eu lieu, on sentait bien pointer l’absurdité de la statistique "Barcelone a donc 0% de chance de qualification, et Milan 0% de chance d’être éliminé". Mais "où" cette absurdité logeait-elle? Elle ne se situait pas, comme on le pense spontanément, dans le nombre 0%, sous prétexte que "ben oui il y a toujours une chance, il ne peut pas y avoir zéro chance de qualification". Le nombre 0% était statistiquement fondé, mathématiquement incontestable: aucun club, depuis 1993, n'avait été éliminé après avoir remporté le match aller 2-0. L’absurdité est cachée dans l'usage du bilan statistique, plus précisément, dans ce "donc" que l’on emploie un peu à la légère: ce n’est pas "parce que" tous les clubs avaient été éliminés dans ce cas de figure, que Barcelone allait devoir faire une croix sur les quart. Ainsi, ce n’est pas "parce que" 37 clubs sur 191 ont été éliminés après un 2-2, que le PSG n'a qu'une chance sur cinq de se qualifier.

 



 

Appliquer le bilan statistique des matches passés au match à venir, cela consiste à faire ce qu’on appelle en philosophie une "inférence inductive": s'appuyant sur ce qui a été, on anticipe ce qui sera. Mais dans quelle mesure sommes-nous légitimes à inférer de ce qui a été (perpétuelle élimination après défaite 2-0), ce qui sera (reproduction de ce cas de figure)? Il n’est pas toujours pertinent de penser qu’un événement qui s’est toujours produit se reproduira. En d’autres termes, ce n’est pas la même chose de dire, d'un côté: "0% des clubs ayant perdu 2-0 au match aller se sont qualifiés en ligue des champions", et de dire, d'un autre: "tel club aujourd’hui, concerné par le cas de figure, a 0% de chance de se qualifier". Passer de l’un à l’autre comme si cela relevait d’une "déduction" est une illusion, voire un mensonge.
 


Cela signifie que les statistiques ne sont pas prédictives

En laissant de côté les usages en physique quantique de la statistique, on doit rappeler qu'en matière de football les statistiques ne sont pas rigoureusement prédictives. Aussi instructives soient-elles, il faut les considérer avec méfiance, les manipuler avec précaution. Ne serait-ce que parce qu'elles ne sont pas toujours grotesques et trompeuses pour autant! En quoi sommes-nous encouragés à considérer que le bilan "19,4% de chance de qualification" a une certaine validité? Nous accordons un certain crédit à ces prédictions, parce que quelque chose nous parait logique: on voit bien pourquoi le score 2-2 à domicile est défavorable. Au match retour, il faudra marquer et vraisemblablement gagner à l’extérieur, or jouer à l’extérieur est plus difficile, l’adversaire a l’appui du public, etc. Le bilan statistique ne sort pas de nulle part: il reflète, il résume un effet logique des circonstances. Il montre qu’effectivement, il est difficile de s’imposer à l’extérieur. Le bilan statistique exprime que dans l’ensemble, certaines logiques sportives (avantage du terrain, règle du but à l’extérieur…) et psychologiques (ascendant sur l’adversaire après le match aller, soutien du public…) sont respectées. Mais ce sont des logiques sportives et psychologiques. Pas des lois de la nature.
 

Ainsi, le bilan statistique montre, reflète, modélise, précise – mais il n’anticipe pas. Sans doute, à partir du moment où certaines causes (2-2 à l'aller) ont mené à l’élimination de l’équipe tenue en échec à domicile, on est autorisé à penser "même causes, mêmes effets". Mais aussi compréhensibles soient les causes, elles ne prédéterminent pas la répétition du cas de figure. En rentrant dans le détail des circonstances, on s’aperçoit que les logiques sportives et psychologiques sont toujours singulières. Si le Barça avait été tenu en échec 2-2 à domicile au match aller, les 80,6% de chance de qualification du PSG seraient largement suspectées.
 

En oubliant ou en refusant cette nuance (les statistiques sont éclairantes, mais pas voyantes, elles paraissent en dire long, mais restent en réalité toujours muettes sur les logiques qui les traversent), on en vient à accorder du crédit à des statistiques relativement stupides, dont le caractère prédictif est cette fois grotesque: envisager, par exemple, que Marseille va perdre je ne sais où parce que cela fait vingt-cinq ans que Marseille perd là-bas, relève de la superstition. Loin d’être prédictif, le renseignement statistique n’est dans ce cas fondé sur aucune logique de terrain. Doit-on induire d’une série de X matches sans défaite qu’elle va continuer, ou qu'il va bien falloir qu'elle s'arrête au prochain match? Contrairement à ce qu’ils croient, l’usage que les parieurs sportifs font de ce genre de documentation n’est jamais rationnel.
 


Cela signifie que les statistiques agissent sur l’imagination

Dans les Pensées, Pascal rappelle que le plus rigoureux et rationnel des philosophes, confortablement positionné sur une planche plus large, plus fiable et plus solide qu’il ne faut, aura cependant peur si au-dessous se trouve un précipice. "L’imagination donne le prix aux choses": la raison et la logique sont moins influentes qu’on ne le croit lorsque nous évaluons un état de fait. Quand les médias annoncent que 120 femmes sont mortes sous les coups de leur mari en 2012, le nombre ne parait pas aussi dramatique que lorsqu’ils clament que tous les trois jours, une femme meurt sous les coups de leur mari.
 

Lorsque je lance cinq fois un dé, la probabilité de faire 6-6-6-6-6 est exactement la même que de faire 1-6-2-1-3 (à savoir une chance sur 7.776, soit 6 puissance 5: à chaque lancé de dé, j’ai une chance sur six d'obtenir le chiffre souhaité). Si je ne pense pas cela spontanément, c’est parce que l’imagination ne me présente pas la suite 1-6-2-1-3 comme étant singulière; ce n’est qu'une des combinaisons qui ne présentent pas six chiffres à la suite, parmi les milliers de combinaisons qui ne présentent pas six chiffres à la suite; elle a donc l’air hautement probable. Il reste bien entendu beaucoup plus probable de réaliser une suite de cinq chiffres différents, qu’une suite de cinq chiffres identiques (puisqu’au second lancé de dé, j’ai cinq chances sur six d’obtenir un chiffre différent du premier), mais en considérant chacune des combinaisons isolément et d'un point de vue statistique, la combinaison 6-6-6-6-6 n’est pas plus incroyable qu’un autre. Au loto, d’un point de vue statistique, 1-2-3-4-5-6 est une combinaison qui a autant de chance de sortir qu’une autre.
 


Cela signifie que les statistiques agissent sur le jeu

Qui cocherait 1-2-3-4-5-6 sur sa grille de loto? Personne. Qui ne s’émerveillait pas si un tel tirage avait lieu? Nous aurions en effet de bonnes raisons de nous émouvoir: quand bien même chaque combinaison a une égale chance de sortir, une combinaison régulière reste moins probable qu’une combinaison irrégulière. Une combinaison régulière est même pratiquement improbable, puisque sur l'ensemble des combinaisons, celles qui sont régulières ne forment qu'une infime proportion. Tellement rares, les combinaisons logiques, qu’elles paraissent ne pouvoir s’afficher que si elles ont été voulues. Ainsi certains sont-ils subjugués lorsque qu'au hasard du déploiement d’une forêt, une clairière en forme de cœur est visible depuis le ciel... Il faudrait bien plutôt s’étonner qu’avec les milliards d’arbres déployés sur la planète, quelques formes géométriques ne soient pas proposées de temps en temps.
 

Mais revenons au foot. Plus ou moins conscients des causes réelles qui opèrent sous les ellipses statistiques, plus ou moins marqués, dans leur imagination, par la séduction des chiffres, l’environnement médiatique du foot, les supporters, les sportifs eux-mêmes, estiment qu’il y a peu de chance de se qualifier en demi-finale de Ligue des champions, ou que tel club va encore perdre à tel endroit. Sans doute cela agit-il même, finalement, sur leur implication.
 

Mais quels sont les faits pertinents à considérer? Les causes agissantes? Pour savoir si Paris va gagner à Barcelone, regarder les précédentes oppositions entre Paris et Barcelone au Camp Nou? On n’y trouverait guère de causes légitimement ré-applicables aujourd’hui, mais pourtant, des "raisons" d'y croire. Considérer les précédents matches joués par d’autres équipes qui avaient fait 2-2 à l’aller? Mais quel est alors le rapport avec ce Barça et ce PSG qui joueront mercredi? Le seul fait pertinent, c’est les options éventuelles. Soit les Parisiens se qualifient, soit ils ne se qualifient pas – la seule statistique qui doit agir sur leur psychologie est qu’ils ont "donc", très précisément, une chance sur deux de passer. CQFD.

 
[1] Source: Poteau rentrant, données sur la période 1970-2009.

Réactions

  • José-Mickaël le 08/04/2013 à 03h38
    J'endosse ma blouse grise et mon collier de barbe... voilà.

    Ce qu'on fait en disant que telle équipe à 20 % de chance de gagner un match, c'est effectivement utiliser les statistiques pour faire de la prédiction. Mais ce n'est pas ça l'erreur que commettent les journalistes : après tout les statistiques servent réellement à faire de la prédiction (entre autre).

    Ces pourcentages correspondent à une estimation ponctuelle d'une proportion. On suppose que le résultat des matchs utilisés pour faire ces calculs (par exemple tous les matchs retour ayant suivi un 0-2 à l'aller) suit une loi de Bernoulli (qualification/élimination avec un certain pourcentage de qualification), et toujours la même (ie le même pourcentage). Sous cette hypothèse, on va chercher à estimer ce pourcentage. Le rapport entre le nombre de qualifications et le nombre de matchs, qu'utilisent les journalistes, est un estimateur sans biais et convergent, nous dit la théorie, donc un bon estimateur de ce pourcentage.

    Problème : un estimateur ne donne pas la valeur exacte du paramètre, mais une valeur approchée. Donc quand on trouve 0 (cas des matchs retour après un 0-2 à l'aller), ça ne veut pas dire 0 mais « pas loin de 0 ».

    Problème plus grave - à mon avis la vraie erreur des journalistes : tous ces matchs ne suivent pas la même loi (celle de Bernoulli, mais pas avec le même pourcentage), or c'était l'hypothèse de base pour utiliser l'estimateur ci-dessus. (Comme le dit l'article, si c'était Barcelone qui avait concédé le 2-2 chez lui, ce ne serait sûrement pas le même pourcentage que lorsque c'est PSG.)

    Donc les statistiques peuvent réellement servir à faire des prédictions, mais pas pour les matchs de coupe d'Europe puisque ceux-ci, présentant des contextes multiples, ne rentrent pas dans les hypothèses de la théorie (suivre une loi de même paramètre).

  • Sens de la dérision le 08/04/2013 à 07h35
    Même si j'en utilise tous les jours, je suis loin d'être pro des stats et des probas. Mais il y a un paramètre, le risque alpha, qui autorise à partir de l'extrapolation d'un échantillon de se tromper.

    La conclusion finale me paraît aussi erronée que de tirer une conclusion définitive des séries en cours. Parce que le résultat d'un match ne se résume pas à un lancer de pièce où il n'y a qu'un paramètre.

  • Jean-Patrick Sacdefiel le 08/04/2013 à 09h11
    Sens de la dérision, il me semble que tu as manqué de sens de la dérision pour interpréter la conclusion de l'article.

  • theviking le 08/04/2013 à 09h51
    Juste une remarque : quand l'auteur parle de la proba de sortir un 6-6-6-6-6 aux dés, le 6 puissance 5 n'est pas bien passé, et du coup, il est écrit 65. Je propose d'écrire 6^5, qui passe bien.

  • Tonton Danijel le 08/04/2013 à 10h41
    37 qualifications sur 191 après un 2-2 à domicile à l'aller... N'y a-t-il pas une inversion?

  • Tonton Danijel le 08/04/2013 à 10h42
    Erratum: je me suis moi aussi trompé, l'article parle de 37 éliminations sur 191, ce qui me perturbe, j'attendais plutôt 37 qualifications sur 191, ce qui me semblerait plus logique et cohérent avec la suite.

  • Pascal Amateur le 08/04/2013 à 10h51
    Lorsque je lance cinq fois un dé, la probabilité de faire 6-6-6-6-6 est exactement la même que de faire 1-6-2-1-3 (à savoir une chance sur 7.776).

    > Bah non. La probabilité est de 30.

    Pour chaque dé, il y a 1 chance sur 6 de faire un 6. Cette probabilité ne varie jamais, les dés étant identiques.

  • theviking le 08/04/2013 à 11h21
    >Pascal Amateur

    Euh non

    1 chance sur 6 de faire un 6. Si tu lances 5 fois le dé, ça fait une chance sur 6*6*6*6*6=6^5, soit les 7 776 évoqués.

  • Pascal Amateur le 08/04/2013 à 11h23
    Non.

    Chaque dé donne une chance sur 6.
    (1/6) + (1/6) + (1/6 + (1/6) + (1/6) = (1/36).

  • Axl le 08/04/2013 à 11h24
    Ca me rappelle ma blague préférée de tous les temps!

    Didier Deschamps décide de tester l’intelligence des joueurs de l'Equipe de France. Il fait venir Cabaye.
    — Yohan, si tu sors te balader dans la rue, y a combien de chances que tu croises un dinosaure ?
    — Un dinosaure ? ! Ben je sais pas, une chance sur un milliard…
    — OK, c’est bon.
    Il fait venir Ménez.
    — Jérémy, si tu sors te balader dans la rue, y a combien de chances que tu croises un dinosaure ?
    — Une chance sur deux.
    — Comment ça ? !
    — Ben soit je croise un dinosaure, soit non.


    [Ce qui est complètement magique avec cette blague c'est que vous pouvez changer les noms des personnages pour humilier vos amis!]

La revue des Cahiers du football