Sauter au contenu
Logo image

Section 5.1 Prélab

La moyenne ou la proportion échantillonnale constituent une première estimation du paramètre de la population. Toutefois, cette estimation, dite ponctuelle, n’offre pas beaucoup de détails quant à sa précision. Il est possible de définir un intervalle autour de la mesure échantillonnale selon une précision souhaitée. On peut alors quantifier le risque d’erreur, c’est-à-dire la proportion des intervalles ainsi construits qui ne contiendraient pas le véritable paramètre de la population.

Feuille d'activités Travail à faire avant le cours

Dans le prélab, on poursuit l’analyse de la base de données BIXI en cherchant à définir un ensemble de valeurs possibles pour estimer la durée moyennes des trajets ainsi que la proportion de trajets effectués par des membres. Il convient encore une fois ici de rappeler qu’en temps normal, les données de la population ne seraient pas disponibles et que cette absences est la raison d’être de faire ces estimations. Le but ici est de faire ces estimations par intervalle de confiance afin de valider la théorie en comparant avec les valeurs réelles dans la population.

1.

Selon le théorème central limite, la distribution de \(\overline{X}\) se rapproche d’une loi normale à mesure que la taille de l’échantillon augmente. Concrètement, on peut dire que \(\overline{X}\) suit une loi approximativement équivalente à \(\mathcal{N}\left(\mu ;\frac{\sigma^2}{n}\right)\text{.}\) Dans cet exercice, on considère des échantillons de taille \(n=30\) avec \(\mu=874,96\) et \(\sigma=694,08\text{.}\)
(a)
Calculer la probabilité que \(\overline{X}\in [626,59;1123,32]\text{.}\)
(b)
Dans le classeur associé à la base de données Bixi, générer à nouveau \(1000\) échantillons de taille \(30\) comme ceux se trouvant dans la feuille Échantillons6. Il est nécessaire de regénérer puisqu’Excel a sans doute changer les valeurs de l’échantillon depuis que les moyennes ont été fixées.
(c)
Calculer les moyennes échantillonnales (si ce n’est pas déjà fait), de même que l’écart type des \(1000\) échantillons.
(d)
Déterminer quelle proportion de ces \(1000\) moyennes échantillonnales se trouvent dans l’intervalle \([626,59;1123,32]\text{.}\) Comparer avec la valeur obtenue à l’exercice (a). Utiliser les [provisional cross-reference: commandes dans l'annexe] NB.SI ou NB au besoin.

2.

Dans la question précédente, l’intervalle \([626,59;1123,32]\) a été choisi afin que la probabilité demandée à la question Tâche 5.1.1.a soit celle obtenue. On explore la construction de cet intervalle.
(a)
Quelle est la valeur de \(z_{\alpha/2}\) pour que la probabilité qu’une variable normale centrée réduite se retrouve dans l’intervalle \([-z_{\alpha/2};z_{\alpha/2}]\) soit égale à \(95\%\text{.}\)
(b)
Vérifier que \([\mu-z_{\alpha/2}\frac{\sigma}{\sqrt{n}};\mu+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}]=[626,59;1123,32]\text{.}\)
(c)
Le terme \(z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\) est appelé la marge d’erreur. Si on fixe \(n=30\text{,}\) que devrait-être \(z_{\alpha/2}\) pour avoir une marge d’erreur de \(50\) secondes?
(d)
Si cette fois on fixe \(\alpha=0.05\text{,}\) déterminer la taille d’échantillon minimale nécessaire afin d’avoir une marge d’erreur de \(50\) secondes.
(e)
Discuter de la différence entre ces deux intervalles de confiance.