Le Cam

L’approximation de la loi binomiale par la loi de Poisson est un résultat classique du programme ECG. Cependant, ce théorème de convergence ne dit rien sur la qualité de l’approximation pour un \( n \) donné. L’inégalité de Le Cam comble cette lacune en fournissant une borne explicite sur l’erreur commise. Cet article rappelle le résultat de convergence en loi, puis énonce et démontre l’inégalité de Le Cam dans le cadre du programme ECG, avant de l’illustrer par une application numérique.

Rappel : convergence de la loi binomiale vers la loi de Poisson

Soit \( \lambda > 0 \) un réel fixé. Pour tout \( n \geq 1 \), on considère une variable aléatoire \( S_n \) suivant la loi binomiale de paramètres \( n \) et \( \displaystyle p_n = \frac{\lambda}{n} \). Le théorème de convergence affirme que pour tout \( k \in \mathbb{N} \) :

\[ \lim_{n \to +\infty} P(S_n = k) = e^{-\lambda} \frac{\lambda^k}{k!}. \]

Autrement dit, la suite \( (S_n) \) converge en loi vers une variable aléatoire suivant la loi de Poisson de paramètre \( \lambda \).

La démonstration classique consiste à écrire, pour \( k \) fixé :

\[ P(S_n = k) = {n \choose k} p_n^k (1 – p_n)^{n-k}, \]

puis à montrer, en utilisant \( \displaystyle p_n = \frac{\lambda}{n} \), que chaque facteur converge vers le terme correspondant de la loi de Poisson lorsque \( n \to +\infty \). En particulier, on utilise la limite fondamentale \( \displaystyle \left(1 – \frac{\lambda}{n}\right)^n \to e^{-\lambda} \).

Ce résultat est un théorème de convergence : il garantit que l’approximation devient exacte à la limite. Mais en pratique, on travaille avec un \( n \) fini et il est légitime de se demander quelle erreur on commet. C’est précisément ce que mesure l’inégalité de Le Cam.

Énoncé de l’inégalité de Le Cam

L’inégalité de Le Cam s’énonce dans un cadre légèrement plus général que le simple cas binomial.

Théorème (inégalité de Le Cam)

Soient \( X_1, X_2, \ldots, X_n \) des variables aléatoires indépendantes, où chaque \( X_i \) suit la loi de Bernoulli de paramètre \( p_i \in [0,1] \). On pose \( \displaystyle S = \sum_{i=1}^{n} X_i \) et \( \displaystyle \lambda = \sum_{i=1}^{n} p_i \).

Alors :

\[ \sum_{k=0}^{+\infty} | P(S = k) – e^{-\lambda} \frac{\lambda^k}{k!} | \leq 2 \sum_{i=1}^{n} p_i^2. \]

Le membre de gauche est appelé distance en variation totale entre la loi de \( S \) et la loi de Poisson de paramètre \( \lambda \). L’inégalité affirme que cette distance est contrôlée par la somme des carrés des paramètres \( p_i \).

Dans le cas particulier où tous les \( p_i \) sont égaux à \( \displaystyle p = \frac{\lambda}{n} \), la borne devient :

\[ \sum_{k=0}^{+\infty} | P(S_n = k) – e^{-\lambda} \frac{\lambda^k}{k!} | \leq 2np^2 = \frac{2\lambda^2}{n}. \]

Cette expression montre que l’erreur d’approximation décroît en \( \displaystyle \frac{1}{n} \), ce qui quantifie précisément la vitesse de convergence.

Conséquence pour chaque valeur de \( k \)

L’inégalité de Le Cam porte sur la somme de toutes les erreurs. On en déduit immédiatement une borne pour chaque valeur de \( k \) individuellement. En effet, chaque terme de la somme étant positif, on a pour tout \( k \in \mathbb{N} \) :

\[ | P(S_n = k) – e^{-\lambda} \frac{\lambda^k}{k!} | \leq \frac{2\lambda^2}{n}. \]

Cette inégalité est remarquablement simple et directement utilisable dans les exercices. Elle signifie que pour chaque valeur de \( k \), la probabilité binomiale et la probabilité de Poisson correspondante diffèrent d’au plus \( \displaystyle \frac{2\lambda^2}{n} \).

Démonstration dans le cas symétrique

Démontrons l’inégalité dans le cas où tous les paramètres sont égaux, c’est-à-dire \( S_n \sim B(n, p) \) avec \( \lambda = np \). La preuve repose sur les fonctions génératrices, qui sont au programme ECG.

La fonction génératrice de \( S_n \) est \( \displaystyle G_{S_n}(t) = (1 – p + pt)^n \), et celle d’une variable de Poisson de paramètre \( \lambda \) est \( \displaystyle G_\lambda(t) = e^{\lambda(t-1)} \).

L’idée est de comparer ces deux fonctions. On introduit la fonction \( h : t \mapsto \ln(1 – p + pt) \), définie pour \( t > 0 \). Avec \( \lambda = np \), on a \( G_{S_n}(t) = e^{n h(t)} \). Un développement de Taylor de \( h \) au voisinage de \( t = 1 \) donne :

\[ h(t) = p(t – 1) – \frac{p^2(t-1)^2}{2(1 – p + p\xi)^2} \]

pour un certain \( \xi \) entre \( 1 \) et \( t \), par la formule de Taylor avec reste intégral. Le terme dominant est \( p(t-1) \), ce qui donne \( nh(t) \approx np(t-1) = \lambda(t-1) \), et donc \( G_{S_n}(t) \approx e^{\lambda(t-1)} = G_\lambda(t) \). Le terme d’erreur fait intervenir \( np^2 = \displaystyle \frac{\lambda^2}{n} \), ce qui explique la borne de l’inégalité.

La démonstration complète et rigoureuse de l’inégalité de Le Cam requiert des techniques de couplage qui dépassent le cadre de cet article. Néanmoins, l’argument par fonctions génératrices ci-dessus éclaire l’origine du terme \( \displaystyle \frac{\lambda^2}{n} \) et permet de comprendre pourquoi l’approximation s’améliore lorsque \( n \) croît.

Application numérique

Pour illustrer la portée de l’inégalité, considérons un exemple concret. On lance \( n = 100 \) fois une pièce truquée dont la probabilité de succès est \( p = 0{,}02 \), de sorte que \( \lambda = np = 2 \).

L’inégalité de Le Cam donne :

\[ | P(S_{100} = k) – e^{-2} \frac{2^k}{k!} | \leq \frac{2 \times 4}{100} = 0{,}08. \]

L’erreur sur chaque probabilité individuelle est donc inférieure à \( 0{,}08 \), ce qui est déjà un bon ordre de grandeur. Pour \( n = 1000 \) et \( p = 0{,}002 \) (toujours \( \lambda = 2 \)), la borne tombe à \( 0{,}008 \), soit une erreur dix fois plus petite.

On peut vérifier numériquement que la borne est en fait assez pessimiste : l’erreur réelle est souvent bien plus petite. Par exemple, pour \( n = 100 \), \( p = 0{,}02 \) et \( k = 2 \), on a \( P(S_{100} = 2) \approx 0{,}2734 \) tandis que \( \displaystyle e^{-2} \frac{2^2}{2!} \approx 0{,}2707 \), soit une erreur réelle de l’ordre de \( 0{,}003 \), bien en dessous de la borne \( 0{,}08 \).

Cas général : somme de Bernoulli non identique

L’intérêt majeur de l’inégalité de Le Cam réside dans le fait qu’elle s’applique à des variables de Bernoulli de paramètres différents.

Considérons \( n \) événements indépendants \( A_1, \ldots, A_n \) de probabilités respectives \( p_1, \ldots, p_n \), et soit \( S \) le nombre total d’événements réalisés. La variable \( S \) ne suit pas une loi binomiale (sauf si tous les \( p_i \) sont égaux), mais l’inégalité de Le Cam affirme que sa loi est proche d’une loi de Poisson de paramètre \( \displaystyle \lambda = \sum_{i=1}^{n} p_i \), avec une erreur contrôlée par \( \displaystyle 2\sum_{i=1}^{n} p_i^2 \).

Ce cadre est typique des problèmes de concours où l’on étudie le nombre d’événements rares parmi un grand nombre d’essais indépendants, avec des probabilités éventuellement différentes.

Travailler la fonction sinus cardinal

Si tu veux travailler cette inégalité de Le Cam, voilà un sujet de concours où tu peux la retrouver.

Conclusion

L’inégalité de Le Cam transforme le résultat qualitatif de convergence en loi en un résultat quantitatif. Elle fournit la borne \( \displaystyle \frac{2\lambda^2}{n} \) sur l’erreur d’approximation dans le cas binomial, et \( \displaystyle 2\sum_{i=1}^{n} p_i^2 \) dans le cas général.

Pour les concours, il faut retenir que l’approximation de Poisson est d’autant meilleure que \( n \) est grand et \( p \) petit. L’inégalité de Le Cam donne un critère précis : dès que \( np^2 \) est petit, l’approximation est fiable. Si un énoncé de concours demande de justifier la qualité d’une approximation de Poisson, cette inégalité constitue un argument rigoureux et élégant.