Pas assez travaillée ou délaissée en classe préparatoire, souvent par manque de temps, la théorie des jeux, qui est une branche des mathématiques, de la philosophie et des sciences sociales, est un outil incontournable en économie. Elle peut être l’œuvre d’un paragraphe entier dans une dissertation et peut apporter une réelle valeur ajoutée à cette dernière et par conséquent bonifier votre copie. La théorie des jeux permet d’appréhender les enjeux géopolitiques, économiques (notre ami Ricardo nous dit que le libre-échange est un gain à somme positive pour tous les pays, mais en réalité, d’après la théorie des jeux, chaque individu préfère pratiquer le protectionnisme) ou encore militaires (ou comment appréhender le désastre de Waterloo par la théorie des jeux…).

Branche introduite par Von Neumann et Morgenstern en 1940, la théorie des jeux est un outil utilisé aussi bien par les économistes que par les stratèges militaires, permettant de prédire et d’analyser les comportements et les choix d’individus rationnels voulant maximiser leurs gains et minimiser leurs pertes en situation d’interaction stratégique, sans connaître le choix des autres. En effet, les choix des uns déterminent et influencent les gains des autres en situation d’interaction stratégique et la théorie des jeux va permettre de prédire la stratégie à adopter par l’agent. Pour choisir la stratégie optimale en univers incertain, les grandes majors américaines (ex. : IBM) et les cabinets de consulting en stratégie d’entreprises introduisent en masse de la théorie des jeux.

Nous présenterons seulement ici, de manière vulgarisée et succincte, l’approche non coopérative de la théorie des jeux, car il existe une autre approche totalement différente au sein de la théorie des jeux : l’approche coopérative plus mathématisée où les individus ont la possibilité de parvenir à un accord mutuellement avantageux. Il s’agit d’une approche normative qui n’introduit pas de prédiction sur l’issue finale. Quelle issue est la plus raisonnable et laquelle permettra d’avantager le plus les deux individus ?

Enfin, dans l’optique de la préparation aux concours, nous traiterons des jeux non coopératifs à information complète exclusivement au travers d’un prisme économique et géopolitique en introduisant les concepts premiers, les paramètres du jeu, la notion d’équilibre de Nash, inventée par le célèbre mathématicien éponyme (voir le film Un Homme d’exception), en veillant bien à distinguer jeux statiques et jeux dynamiques. Nous apporterons, de plus, un éclairage sur les stratégies mixtes ou comment apporter de l’aléatoire et des probabilités dans les stratégies à adopter.

I/ Paramètres et concepts premiers dans les jeux non coopératifs

Héritiers du poker et des jeux de hasard, les jeux non coopératifs, où il y a absence de communication, sont l’objet de notre article. Les conditions et les paramètres à la réalisation de ces jeux sont à établir et à définir pour les mener à bien. Sommes-nous dans un jeu à information parfaite/imparfaite, incomplète/complète ? Va-t-on représenter ce jeu sous la forme d’un tableau ou d’un arbre ? Les décisions sont-elles prises en même temps ou étalées dans le temps ?

Paramètre 1 : jeu non coopératif ou coopératif ?

Vous êtes en présence d‘un jeu non coopératif quand les individus sont interrogés séparément et qu’ils ne peuvent pas communiquer, et ces jeux seront l’objet de notre développement. De plus, dans un jeu non coopératif, il faut qu’il y ait un nombre petit d’agents économiques qui interagissent (par exemple un duopole ou un oligopole). Par exemple, l’approche non coopérative s’intéresse à la concurrence imparfaite avec le cas de quelques entreprises en interaction stratégique qui tentent de maximiser leurs profits avec la meilleure stratégie compte tenu de la stratégie des autres.

Paramètre 2 : jeu statique ou dynamique ?

Le jeu sera statique si les joueurs jouent en même temps ; si le jeu est dynamique, les individus prennent des décisions étalées dans le temps et ce type de jeu peut être plus proche de la réalité. En effet, les logiques d’entrée d’entreprises sur un marché obéissent à ce type de jeu avec des entreprises implantées qui décident à l’instant t+1 de combattre l’entrée sur le marché ou de partager le marché. De plus, ici, ne pas confondre stratégie et actions ; une stratégie est un plan d’actions déterminé par l’individu tout au long du jeu. Et en jeu statique, logiquement, la stratégie du joueur est son action unique.

Paramètre 3 : jeu à information complète ou incomplète ?

Un jeu à information complète est un jeu où vous connaissez la structure du jeu, c’est-à-dire l’identité de tous les joueurs, le nombre de joueurs, l’ordre des décisions, les actions ou les stratégies possibles et les gains ; typiquement, le jeu d’échecs est un jeu à information complète. Si un des éléments indiqués n’est pas présent, le jeu est à information incomplète.

Paramètre 4 : jeu à information parfaite ou imparfaite ?

Un jeu est à information parfaite si chaque joueur connaît l’action entreprise par l’autre joueur antérieurement (en jeu statique, le jeu est évidemment à information imparfaite) ; le jeu est à information imparfaite si au contraire au moins un joueur n’a pas connaissance de ce qu’a joué l’autre joueur antérieurement.

Paramètre 5 : jeu sous forme normale ou extensive ?

Ces questions soulèvent la question de la représentation graphique de ces jeux.

Un jeu sous forme normale est un jeu sous la forme de tableau et généralement, on l’utilise pour les jeux statiques à information imparfaite avec les couples de gains associés.

Un jeu sous forme extensive est un jeu sous la forme d’un arbre et coïncide avec les jeux dynamiques avec des décisions séquentielles prises au cours du temps par les joueurs.

Cas typique : le dilemme du prisonnier

C’est l’histoire de deux brigands (A et B) suspectés d’homicide mais on ne connaît pas réellement leur niveau d’implication ; un des deux est forcément innocent ; ils sont enfermés séparément et ne peuvent communiquer. Chacun a la possibilité soit de dénoncer l’autre soit de se taire.

Supposons que les deux se dénoncent : ils écopent de la peine maximale de deux ans de prison. Ils ne se dénoncent pas mutuellement : ils écopent de un an de prison. L’un dénonce l’autre et l’autre se tait : la balance est libérée et celui qui s’est tu écope de trois années de prison. On peut dès à présent représenter ce jeu sous forme normale avec une matrice de paiement à quatre couples. Ce jeu est à information imparfaite et complète car on a toute la structure du jeu.

Individu A/Individu B Se taire Dénoncer l’autre
Se taire (-1;-1) (-3;0)
Dénoncer l’autre (0 ;-3) (-2;-2)

On aurait tendance à croire que les deux vont converger vers le même couple de stratégies (Se Taire; Se Taire). Pour les deux entreprises, ne pas se dénoncer (qui constitue un optimum de Pareto), c’est le meilleur couple de gains pour les deux individus mais ce n’est pas ce qui va se passer en l’absence de communication (eh oui, la vie économique, ce ne sont pas que des cartels où les entreprises s’entendent).

C’est là que le concept d’équilibre de Nash va intervenir en prédisant un résultat stable quand les agents économiques rationnels en interaction stratégique vont choisir une stratégie qui va être la meilleure compte tenu de la stratégie des autres joueurs. Si le joueur B dénonce le joueur A, A a intérêt à dénoncer aussi (car il écope de deux ans au lieu de trois). Si le joueur B ne dénonce pas le joueur A, A a encore intérêt à dénoncer car il est ainsi libéré au lieu de purger un an de prison.

Même raisonnement par rapport à la stratégie de l’autre joueur pour le joueur B. Si le joueur A dénonce le joueur B, B préférera dénoncer car il écope de deux ans au lieu de trois, et si le joueur A ne dénonce pas le joueur B, B dénoncera quand même car il est libéré au lieu de prendre une année de prison.

Ainsi, l’équilibre de Nash aboutit dans ce jeu au couple de stratégies (Dénoncer l’autre; Dénoncer l’autre) où les deux individus se dénoncent mutuellement alors qu’ils gagneraient à se taire.

L’équilibre atteint est un équilibre de meilleure réponse. À cet équilibre, aucun joueur n’a intérêt à dévier unilatéralement de sa stratégie. Il représente la meilleure stratégie de chaque joueur quelle que soit la stratégie de l’adversaire. On comprend bien mieux pourquoi, au lieu de s’ouvrir à la concurrence internationale, les pays puissent s’engager dans des escalades protectionnistes…

Si un pays s’ouvre, il n’est pas sûr que l’autre pays pratiquera lui aussi le libre-échange donc chacun, compte tenu du choix des autres, a intérêt à pratiquer le protectionnisme.

En géopolitique, on comprend mieux pourquoi deux puissances militaires ont tendance à s’armer alors qu’il serait préférable pour ces pays de coopérer et de parler pour limiter la course aux armements (USA/URSS pendant la guerre froide).

Dans le sport, on comprend mieux aussi pourquoi les athlètes se dopent au lieu de coopérer, ce qui leur permettrait de réduire les risques sur la santé et de tendre vers le fair-play. Ces problèmes sont de l’ordre de la théorie des jeux, et on peut ainsi expliquer pourquoi, en l’absence de communication, on aboutit à ces résultats.

Décider ensemble serait préférable au chacun pour soi et donc à la concurrence. Ainsi, intérêts individuels et collectifs peuvent diverger. C’est pourquoi des institutions (lois, États, organisations internationales de lutte contre le dopage, traités pour arrêter la course aux armements, éthique) ont été mises en place pour régler ce problème du type dilemme du prisonnier.

Autres versions de ces jeux

Jeux dynamiques

Il est possible de faire évoluer ces jeux vers des jeux dynamiques sous forme extensive pour prendre en compte la temporalité et mieux appréhender le monde réel car la majorité des décisions ne sont pas prises simultanément. C’est le cas d’une entreprise B qui joue en premier et qui décide si elle rentrera ou pas sur un marché alors que la firme A en position de monopole devra choisir entre combattre ou non cette entreprise potentielle B si elle rentre sur le marché. C’est à ce moment-là qu’on introduit la méthode de la rétroduction ou de la récurrence à rebours. On part du choix ou sous-jeu du dernier joueur et on remonte vers le présent en déterminant successivement les équilibres de Nash dans chaque sous-jeu. En effet, la méthode de la rétroduction tente de montrer que l’entreprise potentielle rentrante conçoit toutes les stratégies possibles du monopole et avise de rentrer après sur le marché ou non en appliquant la stratégie de meilleure réponse.

Stratégies mixtes

Même en l’absence d’équilibre de Nash en stratégies pures, il y a forcément un équilibre en stratégies mixtes, où le joueur choisit au hasard le coup parmi tous les coups possibles. Cela permet d’ajouter de l’aléatoire dans les jeux. Les stratégies mixtes sont alors une distribution sur les stratégies pures de chaque joueur.

Les stratégies mixtes peuvent tout simplement permettre de répondre à cette question : comment choisir où tirer son penalty ?

L’espagnol Ignacos Palacios Huerta trouve dans le football matière à prouver plusieurs théories. L’exemple des tirs de penaltys au football est un cas de jeu à somme nulle en stratégies mixtes à information complète et imparfaite. Il y a un tireur et un gardien. Quel côté vont choisir le tireur et le gardien ? Le tireur face au but, le joueur doit choisir la zone dans la cage dans laquelle il va tirer (gauche ou droite ?), et c’est identique pour le gardien – il doit choisir sur quel côté il va plonger. Le tireur a bien plus de chances de marquer si le gardien plonge sur le mauvais côté. Pour affiner, les droitiers du pied tirent mieux sur leur côté gauche et les gauchers sur leur côté droit. Les deux parties vont respectivement choisir leur côté de tir et le côté pour effectuer le plongeon non pas en alternant une fois à droite et une fois à gauche mais en « tirant à pile ou face » car le gardien et le joueur auraient connaissance de cette stratégie et pourraient s’adapter.

De plus, ils choisiront le côté de tir pour le tireur et le côté du plongeon pour le gardien au hasard mais avec une préférence logique pour l’un d’entre eux. L’équilibre en stratégie mixte pour le tireur est que sa probabilité de réussir le tir soit indépendante du côté « plongé » et l’équilibre pour le gardien est que sa probabilité d’arrêter le penalty soit indépendante du côté du tir. Pour maximiser la probabilité de marquer, un tireur devrait en théorie placer 61,5 % de ses tirs de son côté naturel, 38,5 % de son côté non naturel. Le gardien devrait plonger du côté naturel du tireur 58 % du temps et 42 % du temps de son côté non naturel. Conclusion : les résultats théoriques sont proches des données empiriques récoltées par l’économiste espagnol sur plusieurs championnats. Les footballeurs seraient donc des mathématiciens et des théoriciens des jeux…

La théorie des jeux est devenue incontournable dans tous les domaines de l’économie, notamment en économie industrielle, mais aussi en théorie de l’économie du travail, en théorie des enchères et du vote, afin d’apporter une analyse prédictive et une explication des comportements des agents en situation d’interaction stratégique… De nombreux théoriciens des jeux ont été couronnés pour leurs travaux, tels que Nash, Selten, et Harsanyi (Prix Nobel d’économie en 1994). En 2005, le prix Nobel d’économie a été remis à Robert Aumann et à Thomas Schellin pour leur analyse sur les conflits. De plus, les asymétries d’information dans les théories des contrats utilisent aussi beaucoup de théorie des jeux.

Suggestion :

ECE : maîtriser la théorie économique en 7 points

Révise efficacement ton ESH avec nos autres articles 🙂