verger — Calcul des probabilités au jeu du verger

Voici encore un programme inspiré de jeux avec ma fille.

Le jeu du Verger est un jeu coopératif classique, reposant beaucoup sur le hasard. J’ai écrit ce programme pour répondre à deux questions :

  • quelle est la probabilité de victoire ;

  • comment cette probabilité varie-t-elle suivant la stratégie utilisée ?

Règle du jeu

Les règles données ici concernent le jeu d’origine ; les nombres donnés peuvent être paramétrés avec les options de ce programme.

Le plateau contient 4 arbres contenant 10 fruits chacun, et un puzzle de corbeau de 9 pièces (vide au départ). C’est un jeu coopératif, et les règles ne changent pas selon le nombre de joueurs, donc nous supposons ici qu’une seule personne joue.

Le dé est composé de 6 faces : une par arbre, une face panier, et une face corbeau.

À son tour de jeu, la joueuse lance le dé :

  • si elle obtient un arbre, elle cueille un fruit de cet arbre (s’il en reste) ;

  • si elle obtient le panier, elle cueille deux fruits au choix ;

  • si elle obtient le corbeau, elle ajoute une pièce du puzzle du corbeau.

Le jeu se termine lorsqu’il ne reste plus aucun fruit sur les arbres (victoire) ou que le puzzle du corbeau est complet (défaite).

Note

Dans toute la suite, nous écrirons abusivement « il reste huit corbeaux » plutôt que « il reste huit pièces de puzzle du corbeau ».

Stratégies

Le seul mécanisme ne mettant pas en jeu le hasard est le choix des fruits à cueillir lorsque le dé indique le panier. Les trois stratégies mise en œuvre sont :

  • max : les deux fruits sont pris depuis le ou les arbres qui en contiennent le plus ;

  • min : les deux fruits sont pris depuis le ou les arbres qui en contiennent le moins ;

  • random : les deux fruits sont pris au hasard.

Calcul des probabilités

Remarques préliminaires

Quels remarques vont simplifier nos calculs.

Premièrement, les arbres sont interchangeables : s’il reste trois pommes et deux poires, la probabilité de victoire est la même que s’il restait trois prunes et deux pommes (la démonstration est laissée au lecteur patient). La conséquence est que, dans le calcul mathématique comme dans le programme informatique, les arbres sont toujours triés (par ordre croissant ou décroissante selon le contexte).

Ensuite, les arbres vides peuvent être supprimés du jeu. Ainsi, jouer avec quatre arbres dont un vide, avec un dé à six faces (quatre arbres, un panier, un corbeau) donne la même probabilité de victoire que jouer avec trois arbres, avec un dé à cinq faces (trois arbres, un panier, un corbeau). La démonstration est laissée au lecteur patient. Donc dans les deux calculs (mathématique et informatique), les arbres vides sont simplement supprimés.

Calcul mathématique

Je n’ai pas étudié mathématiquement le jeu original, mais j’ai étudié un jeu simplifié, avec au maximum deux arbres à deux fruits, et deux corbeaux.

Le graphe probabiliste suivant présente la situation :

  • les états A à J correspondent à des états possibles du jeu, sous la forme ARBRES|CORBEAU. Par exemple, l’état C, marqué 21|2 signifie qu’il reste deux arbres (l’un à deux fruits, l’autre à un seul fruit), et deux corbeaux ;

  • les états K et L correspondent respectivement à la victoire et à la défaite.

Les poids des transitions correspondent au probabilités pour passer d’un état à l’autre.

digraph {
  A[label="A\n22|2", shape=circle];
  B[label="B\n22|1", shape=circle];
  C[label="C\n21|2", shape=circle];
  D[label="D\n21|1", shape=circle];
  E[label="E\n2|2", shape=circle];
  F[label="F\n11|2", shape=circle];
  G[label="G\n2|1", shape=circle];
  H[label="H\n11|1", shape=circle];
  I[label="I\n1|2", shape=circle];
  J[label="J\n1|1", shape=circle];
  K[label="K\n💀", shape=circle];
  L[label="L\n🎉", shape=circle];

  {rank=same; A;}
  {rank=same; B; C;}
  {rank=same; D; E; F;}
  {rank=same; G; H; I;}
  {rank=same; J;}
  {rank=same; K; L;}

  A -> B[label="1/4"];
  A -> C[label="1/2"];
  A -> F[label="1/4"];

  B -> D[label="1/2"];
  B -> H[label="1/4"];
  B -> K[label="1/4"];

  C -> D[label="1/4"];
  C -> E[label="1/4"];
  C -> F[label="1/4"];
  C -> I[label="1/4"];

  D -> G[label="1/4"];
  D -> K[label="1/4"];
  D -> J[label="1/4"];
  D -> H[label="1/4"];

  E -> G[label="1/3"];
  E -> I[label="1/3"];
  E -> L[label="1/3"];

  F -> H[label="1/4"];
  F -> L[label="1/4"];
  F -> I[label="1/2"];

  G -> J[label="1/3"];
  G -> K[label="1/3"];
  G -> L[label="1/3"];

  H -> K[label="1/4"];
  H -> J[label="1/2"];
  H -> L[label="1/4"];

  I -> J[label="1/3"];
  I -> L[label="2/3"];

  J -> K[label="1/3"];
  J -> L[label="2/3"];

  K -> K[label="1"];

  L -> L[label="1"];
}

La matrice probabiliste correspondant à ce graphe est la suivante.

\[\begin{split}M = \begin{bmatrix} 0 & 1/4 & 1/2 & 0 & 0 & 1/4 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1/2 & 0 & 0 & 0 & 1/4 & 0 & 0 & 1/4 & 0 \\ 0 & 0 & 0 & 1/4 & 1/4 & 1/4 & 0 & 0 & 1/4 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 1/4 & 1/4 & 0 & 1/4 & 1/4 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 1/3 & 0 & 1/3 & 0 & 0 & 1/3 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1/4 & 1/2 & 0 & 0 & 1/4 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1/3 & 1/3 & 1/3 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1/2 & 1/4 & 1/4 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1/3 & 0 & 2/3 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1/3 & 2/3 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\ \end{bmatrix}\end{split}\]

Note

La voici également sous une forme qu’il est possible de copier-coller pour faire vos propres manipulations avec XCas.

[[0, 1/4, 1/2, 0, 0, 1/4, 0, 0, 0, 0, 0, 0], [0, 0, 0, 1/2, 0, 0, 0, 1/4, 0, 0, 1/4, 0], [0, 0, 0, 1/4, 1/4, 1/4, 0, 0, 1/4, 0, 0, 0], [0, 0, 0, 0, 0, 0, 1/4, 1/4, 0, 1/4, 1/4, 0], [0, 0, 0, 0, 0, 0, 1/3, 0, 1/3, 0, 0, 1/3], [0, 0, 0, 0, 0, 0, 0, 1/4, 1/2, 0, 0, 1/4], [0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 1/3, 1/3], [0, 0, 0, 0, 0, 0, 0, 0, 0, 1/2, 1/4, 1/4], [0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 0, 2/3], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 2/3], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]]

Pour calculer la probabilité de victoire, et faut calculer l’état stable à partir de l’état initial A (correspondant à la matrice \(A=\begin{bmatrix}1&0&0&0&0&0&0&0&0&0&0&0\end{bmatrix}\)). Ça, c’est la méthode propre.

La méthode « cracra » est de remarquer que quel que soit l’état initial, il devrait converger vers un état stable où tous les coefficients sont nuls, exceptés les deux derniers (la démonstration est laissée au lecteur patient).

Puisque l’état converge, \(A\times M^{1000}\) devrait être très proche de l’état limite. Donc \(A\times M^{1000}=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,322627314815 & 0,677372685185\end{bmatrix}\), et cela signifie qu’avec deux arbres à deux fruits chacun, et deux corbeaux (état A), la probabilité de victoire est environ 0,677.

Voici quelques autres exemples.

\[\begin{split}\begin{align} A\times M^{1000}&=\begin{bmatrix}1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,322627314815 & 0,677372685185\end{bmatrix}\\ B\times M^{1000}&=\begin{bmatrix}0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,628472222222 & 0,371527777778\end{bmatrix}\\ E\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,185185185185 & 0,814814814815\end{bmatrix}\\ F\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,159722222222 & 0,840277777778\end{bmatrix}\\ G\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,444444444444 & 0,555555555556\end{bmatrix}\\ H\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,416666666667 & 0,583333333333\end{bmatrix}\\ I\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,111111111111 & 0,888888888889\end{bmatrix}\\ J\times M^{1000}&=\begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0\end{bmatrix} \times M^{1000} = \begin{bmatrix}0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0,333333333333 & 0,666666666667\end{bmatrix}\\ \end{align}\end{split}\]

Calcul informatique

Comme dans le calcul des probabilités du jeu de mafia, le calcul est fait par récurrence. Pour \(n\) arbres, \(c\) corbeaux, une stratégie de choix de paniers \(panier\), et des arbres contenant \(a_1, a_2, \ldots, a_n\) fruits, dans le cas général, la probabilité de victoire est :

\[\begin{split}\begin{align} P\left(n, c, (a_1, a_2, \ldots, a_n)\right) &= \frac{1}{n+2}\times P\left(n, c-1, (a_1, a_2, \ldots, a_n)\right) \\ &+ \sum_{i=1}^n\frac{1}{n+2}\times P\left(n, c-1, \left(a_1, a_2, \ldots, a_i-1, \ldots, a_n\right)\right) \\ &+ \frac{1}{n+2}\times P\left(n, c-1, panier(a_1, a_2, \ldots, a_n)\right) \\ \end{align}\end{split}\]

Les cas particuliers sont les suivants :

  • si \(n=0\) (tous les fruits ont été cueillis), la probabilité est 1 (victoire) ;

  • si \(c=0\) (le corbeau est complet), la probabilité est 0 (défaite) ;

  • si un arbre n’a plus de fruits, il est supprimé de la liste.

Cela donne le code suivant.

 1@functools.lru_cache(cache_size())
 2def probabilite(corbeau, panier, *arbres):
 3    """Renvoit la probabilité de victoire pour une partie.
 4
 5    :param int corbeau: Nombre de pièces du puzzle restant au corbeau.
 6    :param function panier: Stratégie à utiliser, comme une valeur de :data:`STRATEGIES`.
 7    :param list arbres: Nombre de fruits sur chacun des arbres,
 8        comme une liste décroissante d'entiers strictement
 9        positifs.  Les arbres vides ne sont pas représentés
10        (puisque la probabilité de gagner dans un jeu à quatre
11        arbres dont deux vides est égale à celle de gagner dans un
12        jeu à deux arbres).
13    """
14    # Conditions de victoire et de défaite
15    if sum(arbres) == 0:
16        return 1
17    if corbeau == 0:
18        return 0
19
20    # Appel récursif
21    proba = 0
22
23    # Corbeau
24    proba += probabilite(corbeau - 1, panier, *arbres)
25
26    # Fruit
27    for i in range(len(arbres)):
28        copie = list(arbres)
29        copie[i] -= 1
30        if not copie[i]:
31            del copie[i]
32        proba += probabilite(corbeau, panier, *sorted(copie))
33
34    # Panier
35    if sum(arbres) <= 2:
36        proba += 1
37    else:
38        proba += probabilite(corbeau, panier, *panier(arbres))
39
40    return proba / (len(arbres) + 2)

Validité

Nos calculs sont-ils valides ? Deux indices laissent penser que c’est le cas.

  1. Premièrement, les calculs effectués avec le graphe probabiliste, et avec le programme, donnent le même résultat. Je n’ai pu comparer que pour les petites valeurs (le graphe probabiliste est assez petit), mais cela laisse supposer qu’ils sont aussi corrects pour des valeurs plus grandes.

  2. Ensuite, le programme informatique donne une probabilité de victoire de 0,68, ce qui est égale aux valeurs trouvées ailleurs sur la toile (voir ici et par exemple).

Ces indices ne sont pas des preuves, mais cela permet de supposer que les résultats est correct.

Quelques graphiques

Le graphique suivant compare les probabilités de victoire des stratégies étudiées.

(png, hires.png, pdf)

../_images/verger-1.png

Le graphique suivant calcule, avec neuf corbeaux (comme dans le jeu de base), pour chaque nombre d’arbres et de fruits par arbres, la probabilité de victoire.

(png, hires.png, pdf)

../_images/verger-2.png

Le graphique suivant calcule, pour chaque nombre d’arbres, et de fruits par arbres, le plus petit nombre de corbeaux nécessaire pour que la joueuse ait plus d’une chance sur deux de gagner.

(png, hires.png, pdf)

../_images/verger-3.png

Programme

Calcule la probabilité de victorie au jeu du Verger (Haba).

usage: verger [-h] [-v] [-a ARBRES] [-f FRUITS] [-c CORBEAU]
              [-p {max,min,random}]

Named Arguments

-v, --version

show program’s version number and exit

-a, --arbres

Nombre d’arbres (nombre de types de fruits différents).

Default: 4

-f, --fruits

Nombre de fruits par arbre.

Default: 10

-c, --corbeau

Nombre de pièces du puzzle du corbeau.

Default: 9

-p, --panier

Possible choices: max, min, random

Stratégie à utiliser : max (Choisir l’arbre le moins vide (contenant le plus de fruits).), min (Choisir l’arbre le plus vide (contenant le moins de fruits).), random (Choisir l’arbre au hasard.)

Default: « max »

# Cache

Un cache est utilisé pour accélérer les calculs. Sa taille est définie en définissant la variable d’environnement VERGER_CACHE_SIZE:

  • si cette chaîne est vide, la taille du cache est infini (limitée par les capacités de l’ordinateur) ;

  • si cette variable est un nombre, elle définit la taille du cache ;

  • si cette variable est autre chose, ou non définie, la taille du cache est 2^1000.