L’objectif de cet article est de présenter de manière complète et rigoureuse la loi bêta-binomiale. Cette loi est récurrente dans les sujets de concours, surtout pour les épreuves des Parisiennes. La loi bêta-binomiale est composée à la fois d’une loi à densité et d’une loi discrète. En réalité, elle est fondée sur un mélange de deux lois : une loi binomiale dont le paramètre de succès \(p\) n’est plus une constante, mais une variable aléatoire continue (généralement liée à une loi de type bêta).
Présentation de la loi bêta-binomiale
Modélisation probabiliste et définition des variables aléatoires
On considère une expérience aléatoire constituée de \(n\) répétitions indépendantes d’une même épreuve de Bernoulli, chaque épreuve pouvant donner lieu à un succès ou à un échec. Dans un premier temps, on suppose que la probabilité de succès est égale à un réel \(p\) appartenant à l’intervalle \([0,1]\), fixé.
On définit alors une variable aléatoire \(X\), égale au nombre de succès obtenus au cours des \(n\) épreuves. Par définition, la variable aléatoire \(X\) suit une loi binomiale de paramètres \(n\) et \(p\). Pour tout entier \(k\) compris entre \(0\) et \(n\), on a :
\[
\mathbb{P}(X = k) = {n \choose k} p^{k} (1 – p)^{n – k}.
\]
On rappelle que l’espérance et la variance d’une variable aléatoire suivant une loi binomiale de paramètres \(n\) et \(p\) sont données par :
\[
\mathbb{E}(X) = np
\quad \text{et} \quad
\mathrm{Var}(X) = np(1 – p).
\]
Dans de nombreuses situations concrètes, l’hypothèse selon laquelle la probabilité de succès \(p\) est parfaitement connue peut s’avérer trop restrictive. On adopte alors une modélisation plus réaliste en supposant que cette probabilité est elle-même aléatoire.
On introduit ainsi une variable aléatoire \(P\), définie sur le même espace probabilisé, représentant la probabilité de succès des épreuves. La variable \(P\) prend ses valeurs dans l’intervalle \([0,1]\). En conditionnant à l’événement \(\{P = p\}\), la variable aléatoire \(X\) suit une loi binomiale de paramètres \(n\) et \(p\).
On suppose que la variable aléatoire \(P\) suit une loi bêta de paramètres \(\alpha\) et \(\beta\), où \(\alpha\) et \(\beta\) sont deux entiers naturels non nuls. Cette loi n’étant pas étudiée en tant que telle dans le programme officiel de la filière ECG, on en donne directement la définition par sa densité.
La variable aléatoire \(P\) admet une densité \(f_P\), définie pour tout réel \(p\) par :
\[
f_P(p) =
\begin{cases}
\frac{(\alpha + \beta – 1)!}{(\alpha – 1)! (\beta – 1)!}
p^{\alpha – 1} (1 – p)^{\beta – 1}
& \text{si } p \in [0,1], \\
0 & \text{sinon}.
\end{cases}
\]
Cette fonction est positive et son intégrale sur l’intervalle \([0,1]\) est égale à \(1\), ce qui garantit qu’elle définit bien une loi de probabilité sur \([0,1]\).
Définition de la loi bêta-binomiale
On s’intéresse désormais à la loi de la variable aléatoire \(X\), sans conditionnement, c’est-à-dire en tenant compte de l’aléa portant sur la probabilité de succès \(P\).
Pour tout entier \(k\) compris entre \(0\) et \(n\), la formule des probabilités totales (HP entre des lois discrètes et à densités) permet d’écrire :
\[
\mathbb{P}(X = k)
= \int_{0}^{1} \mathbb{P}(X = k \mid P = p) f_P(p)\,\mathrm{d}p.
\]
Or, conditionnellement à l’événement \(\{P = p\}\), la variable aléatoire \(X\) suit une loi binomiale de paramètres \(n\) et \(p\). On a donc :
\[
\mathbb{P}(X = k \mid P = p)
= {n \choose k} p^{k} (1 – p)^{n – k}.
\]
En substituant cette expression dans l’intégrale précédente, on obtient :
\[
\mathbb{P}(X = k)
=
{n \choose k}
\frac{(\alpha + \beta – 1)!}{(\alpha – 1)! (\beta – 1)!}
\int_{0}^{1}
p^{k + \alpha – 1}
(1 – p)^{n – k + \beta – 1}
\,\mathrm{d}p.
\]
L’intégrale précédente est l’intégrale d’une densité de loi bêta, ce qui permet de la calculer explicitement. On obtient alors :
\[
\int_{0}^{1}
p^{k + \alpha – 1}
(1 – p)^{n – k + \beta – 1}
\,\mathrm{d}p
=
\frac{(k + \alpha – 1)! (n – k + \beta – 1)!}
{(n + \alpha + \beta – 1)!}.
\]
Finalement, pour tout entier \(k\) appartenant à \(\{0,\dots,n\}\), on a :
\[
\mathbb{P}(X = k)
=
{n \choose k}
\frac{(\alpha + \beta – 1)!}{(\alpha – 1)! (\beta – 1)!}
\frac{(k + \alpha – 1)! (n – k + \beta – 1)!}
{(n + \alpha + \beta – 1)!}.
\]
La variable aléatoire \(X\) suit alors ce que l’on appelle une loi bêta-binomiale de paramètres \(n\), \(\alpha\) et \(\beta\).
Petite précision : on ne te demandera jamais de retrouver cette loi. On a utilisé des théorèmes et des lois qui ne sont pas au programme d’ECG. Il est quand même bien d’avoir déjà vu sa forme.
Cas particulier : \(\alpha = \beta = 1\)
Un cas particulièrement instructif est celui où les paramètres de la loi bêta vérifient
\[
\alpha = 1 \quad \text{et} \quad \beta = 1.
\]
Loi de la variable \(P\)
Dans ce cas, la densité de la variable aléatoire \(P\) devient
\[
f_P(p)
= \frac{(1+1-1)!}{(1-1)!(1-1)!} \, p^{0}(1-p)^{0},
\quad \text{pour } p \in [0,1].
\]
Or, \(0! = 1\), donc :
\[
f_P(p) = 1 \quad \text{pour } p \in [0,1].
\]
Ainsi, la variable aléatoire \(P\) suit la loi uniforme sur l’intervalle \([0,1]\).
Cette situation correspond à une absence totale d’information sur la probabilité de succès : toutes les valeurs de \(p\) entre 0 et 1 sont équiprobables.
Loi de la variable \(X\)
On rappelle que, pour tout entier \(k \in \{0,\dots,n\}\),
\[
\mathbb{P}(X = k)
= \int_0^1 \mathbb{P}(X = k \mid P = p) f_P(p)\,\mathrm{d}p.
\]
Comme \(f_P(p)=1\) sur \([0,1]\) et que conditionnellement à \(\{P=p\}\),
\[
\mathbb{P}(X = k \mid P = p)
={n \choose k} p^{k} (1 – p)^{n – k}.
\]
On obtient :
\[
\mathbb{P}(X = k)
= {n \choose k} \int_0^1 p^k (1-p)^{n-k}\,\mathrm{d}p.
\]
On utilise le résultat classique, valable pour tous entiers naturels \(u\) et \(v\) :
\[
\int_0^1 t^u (1-t)^v\,\mathrm{d}t
= \frac{u!\,v!}{(u+v+1)!}.
\]
En prenant \(u = k\) et \(v = n-k\), on obtient :
\[
\int_0^1 p^k (1-p)^{n-k}\,\mathrm{d}p
= \frac{k!(n-k)!}{(n+1)!}.
\]
Ainsi,
\[
\mathbb{P}(X = k)
= {n \choose k} \frac{k!(n-k)!}{(n+1)!}.
\]
Or,
\[
{n \choose k} = \frac{n!}{k!(n-k)!},
\]
Donc :
\[
\mathbb{P}(X = k)
= \frac{n!}{k!(n-k)!} \cdot \frac{k!(n-k)!}{(n+1)!}
= \frac{n!}{(n+1)!}
= \frac{1}{n+1}.
\]
On obtient alors, pour tout \(k \in \{0,\dots,n\}\),
\[
\mathbb{P}(X = k) = \frac{1}{n+1}.
\]
La variable aléatoire \(X\) suit donc la loi uniforme discrète sur l’ensemble \(\{0,1,\dots,n\}\).
Interprétation
Lorsque \(P\) suit la loi uniforme sur \([0,1]\), toutes les probabilités de succès sont également plausibles. L’incertitude sur le paramètre est maximale. Après prise en compte de cette incertitude, aucune valeur du nombre de succès n’est privilégiée : toutes les valeurs entre \(0\) et \(n\) deviennent équiprobables.
Exemple concret
On considère un questionnaire de \(n\) questions à choix binaire. Pour un candidat donné, la probabilité de répondre correctement à une question est \(P\), inconnue et supposée variable d’un candidat à l’autre. En l’absence d’information sur le niveau du candidat, on suppose que \(P\) suit la loi uniforme sur \([0,1]\).
Conditionnellement à \(P\), le nombre de bonnes réponses suit une loi binomiale. Globalement, le nombre total de bonnes réponses suit alors une loi uniforme sur \(\{0,\dots,n\}\).
Espérance de la loi bêta-binomiale
On rappelle que la variable aléatoire \(X\) est définie comme le nombre de succès lors de \(n\) épreuves de Bernoulli et que, conditionnellement à l’événement \(\{P=p\}\), la variable aléatoire \(X\) suit une loi binomiale de paramètres \(n\) et \(p\).
On utilise la formule de l’espérance totale :
\[
\mathbb{E}(X)=\mathbb{E}\big(\mathbb{E}(X\mid P)\big).
\]
Conditionnellement à l’événement \(\{P=p\}\), on a la variable aléatoire \(X\) qui suit une loi binomiale de paramètres \(n\) et \(p\), donc
\[
\mathbb{E}(X\mid P=p)=np.
\]
On en déduit, en remplaçant \(p\) par la variable aléatoire \(P\),
\[
\mathbb{E}(X\mid P)=nP.
\]
Ainsi,
\[
\mathbb{E}(X)=\mathbb{E}(nP)=n\mathbb{E}(P).
\]
Il reste donc à calculer \(\mathbb{E}(P)\). Par définition, puisque \(P\) admet la densité
\[
f_P(p)=\frac{(\alpha+\beta-1)!}{(\alpha-1)!(\beta-1)!}\,p^{\alpha-1}(1-p)^{\beta-1}\,\mathbf{1}_{[0,1]}(p),
\]
On a
\[
\mathbb{E}(P)=\int_0^1 p f_P(p)\,\mathrm{d}p
=\frac{(\alpha+\beta-1)!}{(\alpha-1)!(\beta-1)!}\int_0^1 p^{\alpha}(1-p)^{\beta-1}\,\mathrm{d}p.
\]
On utilise alors le résultat suivant, valable pour tous entiers \(u,v\in\mathbb{N}\) :
\[
\int_0^1 t^{u}(1-t)^{v}\,\mathrm{d}t=\frac{u!\,v!}{(u+v+1)!}.
\]
On peut le justifier par récurrence sur \(u\) en appliquant une intégration par parties à
\(\int_0^1 t^{u}(1-t)^{v}\,\mathrm{d}t\), ce qui fournit une relation de récurrence reliant l’intégrale d’indice \(u\) à celle d’indice \(u-1\), puis en initialisant au cas \(u=0\).
En l’appliquant ici avec \(u=\alpha\) et \(v=\beta-1\), on obtient :
\[
\int_0^1 p^{\alpha}(1-p)^{\beta-1}\,\mathrm{d}p
=\frac{\alpha!(\beta-1)!}{(\alpha+\beta)!}.
\]
Donc :
\[
\mathbb{E}(P)
=\frac{(\alpha+\beta-1)!}{(\alpha-1)!(\beta-1)!}\cdot\frac{\alpha!(\beta-1)!}{(\alpha+\beta)!}.
\]
En simplifiant, on utilise \(\alpha!=\alpha(\alpha-1)!\) et \((\alpha+\beta)!=(\alpha+\beta)(\alpha+\beta-1)!\), d’où
\[
\mathbb{E}(P)=\frac{\alpha}{\alpha+\beta}.
\]
Finalement, on obtient l’espérance de \(X\) :
\[
\mathbb{E}(X)=n\mathbb{E}(P)=n\frac{\alpha}{\alpha+\beta}.
\]
Sujets de concours avec la loi bêta-binomiale
Cette loi est courante dans les sujets HEC/ESSEC. Elle peut faire l’objet d’un problème entier ou d’un exercice unique. Son étude fait appel à plein de connaissances d’analyses et de probabilités du programme d’ECG.
Tu peux retrouver cette constante dans le sujet Maths HEC ECE 2018.
Conclusion
La loi bêta-binomiale est un excellent test de ta maîtrise des lois à densité et du conditionnement. Nous n’avons pas étudié la variance de cette loi, car nous aurions dû utiliser la formule de la variance totale, qui est hors-programme.



