Sauter au contenu
Logo image

Section 5.2 Laboratoire

Comme mentionné dans l’introduction, on n’a normalement pas accès aux valeurs de la population. On va alors tenter de reproduire le calcul d’un intervalle équivalent à celui de l’exercice (5.1.1.a), mais qui sera centré autour de \(\overline{x}\) et qui utilisera \(s\) plutôt que \(\sigma\text{.}\) Les intervalles auront la forme
\begin{equation} \left[\overline{x}-z_{\alpha/2}\frac{s}{\sqrt{n}};\overline{x}+z_{\alpha/2}\frac{s}{\sqrt{n}} \right]\text{,}\tag{5.2.1} \end{equation}
\(\alpha=0.05\text{.}\) On reproduit ainsi un intervalle dont le risque d’erreur est de \(5\%\text{.}\) Ci-dessous, on analyse l’impact de prendre \(s\) comme approximation de \(\sigma\text{.}\)

Sous-section 5.2.1 Intervalles pour une moyenne

Créer une nouvelle feuille de calculs nommée « Intervalle1 » dans le fichier Bixi. Dans la plage A1:B4, inscrire dans la colonne A les étiquettes \(n=\text{,}\)\(\text{alpha}=\) et \(z\text{alpha}/2=\) et entrer \(30\) et \(0.05\) dans B1 et B2 respectivement pour \(n\) et alpha. Calculer à l’aide des formules de la loi normale la valeur de \(z_{\alpha/2}\text{.}\)
On commence par construire un tableau qui contiendra les moyennes échantillonnales, les écart types échantillonnaux, ainsi que les bornes inférieures et supérieures de l’intervalle de l’équation (5.2.1) des échantillons créés à l’exercice 5.1.1.b. Pour cela,
  1. Reporter les moyennes pour analyse et les écarts types calculés à l’exercice 5.1.1.c;
  2. Ensuite, calculer les bornes inférieures et supérieures de chaque intervalle selon la formule (5.2.1);
  3. Ajouter une ligne (ou une colonne, selon la construction précédente) qui déterminera si \(\mu\) se retrouver dans l’intervalle pour chaque valeurs \(\overline{x}\text{.}\) Pour cela, on utilise ensemble les commandes SI et ET. La commande SI retournera \(1\) si sa condition est remplie et \(0\) sinon. La condition en tant que telle sera donnée par la fonction ET, qui vérifiera si la véritable moyenne est dans l’intervalle. La formule ressemblera à SI(ET($B$4>=H2;$B$4<=I2);1;0). Dans cet exemple, la cellule B4 contient la vraie moyenne de la population et les cellules H2 et I2 sont respectivement les bornes inférieures et supérieures de l’intervalle de confiance;
  4. Calculer la proportion des intervalles qui contiennent \(\mu\text{.}\) Pour cela, il suffit de compter combien de \(1\) ont été retournés par les fonctions SI et de diviser par le nombre d’échantillons totaux, soit \(1000\) dans ce cas. Comparer avec le résultat « attendu » de \(95\%\text{.}\) Au besoin, recalculer la feuille avec Shift+F9 si le calcul automatique est désactivé.
À présent, on s’intéresse au résultat des questions 5.1.2.c et 5.1.2.d du pré-laboratoire.
Créer une copie de la feuille Intervalle1 et modifier la valeur de \(\alpha\) afin qu’elle corresponde à la valeur de l’exercice 5.1.2.c. Vérifier que la proportion des intervalles contenant la moyenne est près du niveau de confiance attendu et vérifier également que la marge d’erreur est d’environ \(50\) secondes. en ajoutant une colonne ou une ligne «marge d’erreur».
Créer ensuite une série de nouvelles feuilles afin de tirer \(100\) échantillons de la taille appropriée, soit celle calculée à la question 5.1.2.d. Vérifier que la proportion des intervalles contenant la moyenne est près du niveau de confiance \(95\%\) et vérifier également que la marge d’erreur est d’environ \(50\) secondes, comme il est attendu.
En vertu de ces constructions, est-ce que la réponse à l’exercice Tâche 5.1.2.e est toujours la bonne?

Sous-section 5.2.2 Intervalles pour une proportion

À l’Activité 4.3.7, on a considéré la proportion de trajets effectués en BIXI qui proviennent des membres de la plateforme. On va construire un intervalle de confiance pour ce paramètre. On note \(\pi\) la proportion théorique de la population. On cherche à étudier le comportement d’un intervalle de confiance construit autour d’une estimation ponctuelle \(p\text{.}\) Si l’on considère qu’être membre de BIXI est un succès, alors la variable \(X\) représentant le nombre de membres dans un échantillon aléatoire pris avec remise suit une loi binomiale de paramètres \(n,\pi\text{.}\) Sous les conditions \(n\geq 30, n\pi\geq 5\) et \(n(1-\pi)\geq 5\text{,}\) alors on peut montrer que la proportion \(P=\frac{X}{n}\) se comporte approximativement comme une loi normale. On dit alors que
\begin{equation*} \frac{X}{n}\sim \mathcal{N}\left(\pi; \frac{\pi(1-\pi)}{n}\right) \end{equation*}
sous les conditions nommées plus haut.
Si \(p\) est l’estimation ponctuelle provenant d’un échantillon, on a alors
\begin{equation*} \pi\in \left[p-z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}};p+z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}\right] \end{equation*}
à un niveau de confiance de \(1-\alpha\text{.}\)
Puisque le but est d’estimer la proportion \(\pi\) inconnue, on remplace sa valeur dans l’intervalle par l’estimation
\begin{equation} \pi\in \left[p-z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}};p+z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right]\text{,}\tag{5.2.2} \end{equation}
ce qui constitue l’intervalle de confiance pour la proportion \(\pi\text{.}\)
  1. Créer une nouvelle feuille de calculs appelée «Intervalle proportion1 ».
  2. Comme on l’a fait à l’exercice 5.1.1.d, on commence par regarder la proportion des valeurs estimées \(p\) se retrouve dans l’intervalle théorique \(\left[\pi-z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}};\pi+z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}\right]\text{.}\) Le résultat devrait ressembler à celui de la figure Figure 5.2.1.
  3. Pour chacun des \(100\) échantillons générés à l’exercice 4.3.7, construire l’intervalle de confiance selon la formule (5.2.2) et vérifier dans combien de ces intervalles se trouve la véritable proportion \(\pi\text{.}\)
described in detail following the image
Une capture d’écran d’un tableau de sept lignes et deux colonnes est montré. La première colonne contient les étiquettes des éléments nécessaire au calcul d’un intervalle de confiance théorique pour la proportion et la seconde leur valeur. On a donc la véritable proportion \(\pi\text{,}\) la taille de l’échantillon \(n\text{,}\) le niveau de risque \(\alpha\text{,}\) le facteur \(z_{\alpha/2}\text{.}\) De plus, on y retrouve la borne inférieure et la borne supérieure de l’intervalle de confiance ainsi que le pourcentage des estimations qui sont dans l’intervalle.
Figure 5.2.1. Proportion des estimations \(p\) dans l’intervalle de confiance