
Quand les données mentent : trouver des stratégies optimales pour les tirs au but grâce à la théorie des jeux
Les penaltys font partie des moments les plus décisifs et les plus stressants du football. Un seul coup de pied, avec seulement le gardien à battre, peut déterminer l’issue d’un match entier ou même d’un championnat. Du point de vue de la science des données, ils offrent quelque chose d’encore plus intéressant : un environnement contrôlé unique pour étudier la prise de décision dans un contexte d’incertitude stratégique.
Contrairement au jeu ouvert, les tirs au but comportent une distance fixe, un seul botteur, un seul gardien de but et un ensemble limité d’actions clairement définies. Cette simplicité en fait un cadre idéal pour comprendre comment les données et la stratégie interagissent.
Supposons que nous voulions répondre à une question apparemment simple :
Où un botteur doit-il tirer pour maximiser la probabilité de marquer ?
À première vue, l’examen des données historiques semble suffisant pour répondre à cette question. Cependant, comme nous le verrons, se fier uniquement à des statistiques brutes peut conduire à des conclusions trompeuses. Lorsque les résultats dépendent d’interactions stratégiques, les décisions optimales ne peuvent être déduites uniquement des moyennes.
À la fin de cet article, nous verrons pourquoi la stratégie la plus efficace pour tirer un penalty n’est pas celle suggérée par les données brutes, comment la théorie des jeux explique cet apparent paradoxe et comment un raisonnement similaire s’applique à de nombreux problèmes du monde réel impliquant la concurrence et le comportement stratégique.
Le piège des taux de conversion bruts
Imaginez avoir accès à un ensemble de données contenant de nombreuses observations historiques de tirs au but. Une première grandeur naturelle que nous pourrions envisager de mesurer est le taux de score associé à chaque direction de tir.
Supposons que nous découvrions que les pénalités dirigées vers le centre sont converties plus souvent que celles dirigées vers les côtés. La conclusion peut paraître évidente : les kickers doivent toujours viser le centre.
L’hypothèse cachée derrière ce raisonnement est que le comportement du gardien reste inchangé. Mais en réalité, les sanctions ne sont pas des décisions indépendantes. Il s’agit d’interactions stratégiques dans lesquelles les deux acteurs s’adaptent continuellement l’un à l’autre.
Si les botteurs commençaient soudainement à viser au centre à chaque fois, les gardiens de but réagiraient rapidement en restant plus souvent au milieu.
Le taux de réussite historique des tirs centraux reflète donc un comportement stratégique passé plutôt que la supériorité intrinsèque de ce choix.
Le problème n’est donc pas d’identifier la meilleure action isolément, mais de trouver un équilibre dans lequel aucun des deux joueurs ne peut améliorer son résultat en changeant de stratégie. En théorie des jeux, cet équilibre est appelé Équilibre de Nash.
Formaliser les sanctions comme un jeu à somme nulle
Les tirs au but peuvent naturellement être modélisés comme un jeu à somme nulle à deux joueurs. Le botteur et le gardien de but doivent choisir simultanément une direction. Pour simplifier les choses, supposons qu’ils n’aient que trois choix possibles :
- Gauche (L)
- Centre (C)
- Droite (D)
En faisant leur choix, les botteurs visent à maximiser leur probabilité de marquer, tandis que les gardiens visent à la minimiser.
Si désigne la probabilité de marquer, alors le gain du botteur est alors que la récompense du gardien est . Le gain, cependant, n’est pas une constante fixe, car il dépend du choix combiné des deux joueurs. Nous pouvons représenter le gain sous forme de matrice :
,
…où chaque élément représente la probabilité de marquer si le botteur choisit la direction et le gardien choisit la direction .
Plus tard, nous estimerons ces probabilités à partir de données passées, mais commençons par construire une certaine intuition sur le problème à l’aide d’un modèle simplifié.
Un modèle de jouet
Pour définir un modèle simple mais raisonnable pour la matrice de gains, nous supposons que :
- Si le tireur et le gardien choisissent des directions différentes, le résultat est toujours un but ( pour ).
- Si les deux choisissent le centre, le tir est toujours arrêté par le gardien ().
- Si les deux choisissent le même camp, un but est marqué des temps ().
Cela donne la matrice de gains suivante :
.
Stratégies d’équilibre
Comment pouvons-nous trouver les stratégies optimales pour le kicker connaissant la matrice des gains ?
Il est facile de comprendre qu’avoir une stratégie fixe, c’est-à-dire toujours faire le même choix, ne peut pas être optimal. Si un tireur visait toujours dans la même direction, le gardien de but pourrait immédiatement exploiter cette prévisibilité. De même, un gardien qui plonge toujours de la même manière serait facile à vaincre.
En ordre pour atteindre l’équilibre et rester inexploitable, les joueurs doivent randomiser leur choixc’est ce qu’on appelle dans la théorie des jeux avoir un stratégie mixte.
Une stratégie mixte est décrite par un vecteur dont les éléments sont les probabilités de faire un choix particulier. Notons la stratégie mixte du kicker comme
,
et la stratégie mixte du gardien comme
.
L’équilibre est atteint lorsqu’aucun joueur ne peut améliorer son résultat en changeant unilatéralement sa stratégie. Dans ce contexte, cela implique que les botteurs doivent randomiser leurs tirs de manière à rendre les gardiens de but indifférents à l’idée de plonger à gauche, à droite ou de rester au centre. Si une direction offrait un taux d’arrêt attendu plus élevé, les gardiens de but l’exploiteraient, obligeant les botteurs à s’ajuster.
En utilisant la matrice de gains définie précédemment, nous pouvons calculer la probabilité de marquer attendue pour chaque choix possible du gardien de but :
- si le gardien plonge vers la gauche, la probabilité de marquer attendue est :
- si le gardien reste au centre :
- si le gardien plonge à droite :
Pour que la stratégie du kicker soit une stratégie d’équilibre, il faut trouver , , de telle sorte que pour les gardiens de but, la probabilité d’encaisser un but ne change pas avec leur choix, c’est-à-dire que nous avons besoin de cela
,
qui, avec la condition de normalisation de la stratégie
,
donne un système linéaire de trois équations. En résolvant ce système, nous trouvons que la stratégie d’équilibre pour le kicker est
.
Il est intéressant de noter que même si les plans centraux sont les plus faciles à enregistrer lorsqu’ils sont prévus, les prises de vue centrées sur des temps rend toutes les options également efficaces. Les tirs centraux fonctionnent précisément parce qu’ils sont rares.
Maintenant que nous connaissons la théorie des jeux et l’équilibre de Nash, nous pouvons enfin nous tourner vers des données du monde réel et tester si les joueurs professionnels se comportent de manière optimale.
Apprendre des données du monde réel
Nous analysons un ensemble de données ouvert (licence CC0) contenant 103 tirs au but lors de la saison 2016-2017 de la Premier League anglaise. Pour chaque penalty, l’ensemble de données enregistre la direction du tir, la direction choisie par le gardien de but et le résultat final.
En explorant les données, nous constatons que le taux de notation global d’une pénalité est d’environ et que les tirs centraux semblent être les plus efficaces. On retrouve notamment les taux de notation suivants pour différentes directions de tir :
- Gauche: ;
- Centre: ;
- Droite: .
Cependant, afin de dériver les stratégies optimales, nous devons reconstruire la matrice des gains, ce qui nécessite d’estimer neuf taux de conversion, un pour chaque combinaison possible de choix du botteur et du gardien de but.
Cependant, avec seulement 103 observations dans notre ensemble de données, certaines combinaisons sont rencontrées assez rarement. Par conséquent, l’estimation de ces probabilités directement à partir de décomptes bruts introduirait un bruit important.
Puisqu’il n’y a aucune raison solide de croire que les côtés gauche et droit de l’objectif soient fondamentalement différents, nous pouvons améliorer la robustesse de notre modèle en imposant symétrie entre les deux côtés et agréger des situations équivalentes.
Cela réduit efficacement le nombre de paramètres à estimer, réduisant ainsi la variance de nos estimations de probabilité et augmentant la robustesse de la matrice de gains résultante.
Sous ces hypothèses, la matrice de gains empiriques devient :
.
Nous pouvons voir que la matrice de gains mesurée est assez similaire au modèle de jouet que nous avons défini précédemment, la principale différence étant qu’en réalité les botteurs peuvent rater le but même si le gardien de but choisit la mauvaise direction.
Résoudre pour stratégies d’équilibreon trouve :
.
Les joueurs sont-ils réellement optimaux ?
La comparaison des stratégies d’équilibre avec le comportement observé révèle une tendance intéressante.

Les kickers se comportent de manière presque optimalebien qu’ils visent le centre un peu moins souvent qu’ils ne le devraient ( des fois au lieu de 22 %).
D’autre part, les gardiens s’écartent considérablement de leur stratégie optimale, restant au centre seulement des temps au lieu de l’optimal .
Cela explique pourquoi les plans centraux semblent particulièrement réussis dans les données historiques. Leur taux de conversion élevé n’indique pas une supériorité intrinsèque, mais plutôt une inefficacité systématique dans le comportement des gardiens.
Si les gardiens et les gardiens de but suivaient parfaitement leurs stratégies d’équilibre, les tirs centraux seraient marqués à peu près du temps, ce qui est proche de la moyenne mondiale.
Au-delà du football : une perspective de science des données
Bien que les tirs au but constituent un exemple intuitif, le même phénomène apparaît dans de nombreuses applications réelles de la science des données.
Les systèmes de tarification en ligne, les marchés financiers, les algorithmes de recommandation et les défenses de cybersécurité impliquent tous que les agents s’adaptent au comportement de chacun. Dans de tels environnements, les données historiques reflètent un équilibre stratégique plutôt que des résultats passifs. Une stratégie de tarification qui semble optimale au vu des données passées peut cesser de fonctionner une fois que les concurrents réagissent. De même, les systèmes de détection de fraude modifient le comportement des utilisateurs dès leur déploiement.
Dans des environnements compétitifs, l’apprentissage à partir des données nécessite une modélisation de l’interaction, et pas seulement une corrélation.
Conclusions
Les tirs au but illustrent une leçon plus large pour l’optimisation de la prise de décision basée sur les données.
Les moyennes historiques ne révèlent pas toujours des décisions optimales. Lorsque les résultats émergent d’interactions stratégiques, les données observées reflètent un équilibre entre agents concurrents plutôt que la qualité intrinsèque des actions individuelles.
Comprendre le mécanisme qui génère les données est donc essentiel. Sans modélisation du comportement stratégique, les statistiques descriptives peuvent facilement être confondues avec des orientations prescriptives..
Le véritable défi pour les data scientists n’est donc pas seulement d’analyser ce qui s’est passé, mais aussi de comprendre pourquoi des agents rationnels ont provoqué cela en premier lieu.



