Sauter au contenu
Logo image

Section 4.1 Prélab

BIXI Montréal est un organisme à but non lucratif créé en 2014 par la Ville de Montréal pour gérer le système de vélopartage à Montréal. Le réseau comprend plus de 11 000 vélos (dont 2 600 BIXI électriques) et plus de 900 stations sur le territoire montréalais, ainsi qu’à Laval, Longueuil, Boucherville, Terrebonne, Sainte-Julie, Westmount, Ville de Mont-Royal et Montréal-Est. Beaucoup plus qu’un simple mode de transport, BIXI est aujourd’hui un fabuleux raccourci qui permet de circuler librement dans la ville où et quand on le désire pour aller où l’inspiration et/ou le devoir nous mène.
 1 
Texte tiré de https://bixi.com/fr/qui-sommes-nous/, page consultée le 16 octobre 2024.
L’organisme BIXI Montréal compile les données des trajets effectués par les utilisateurs depuis le tout début. Ces données sont disponibles pour le grand public.

Feuille d'activités Travail à faire avant le cours

Dans ce laboratoire, on explore le comportement de la moyenne d’un échantillon. Pour cela, on considère le temps de tous les trajets effectués en BIXI sur l’ile de Montréal lors du mois d’août 2016, qui fait office de population. Les données proviennent du site web de Bixi
 2 
bixi.com/fr/donnees-ouvertes/
et ont été nettoyées un peu afin de les structurer et d’éliminer des variables non pertinentes pour l’objet de ce laboratoire. L’organisme a répertorié près de \(700\,000\) trajets lors de cet unique mois. Le but de ce laboratoire est de voir comment la moyenne estimée par un échantillon varie selon l’échantillon qui est sondé.

1.

L’un des objectifs du laboratoire est d’observer le comportement de la moyenne d’un échantillon par rapport à la véritable moyenne de la population en fonction de l’échantillon choisi. Afin de bien cerner ce contexte théorique, on propose un exemple simple illustrant certains des concepts qui seront par la suite approfondis.
On considère une population de \(5\) individus dont la hauteur (en cm) est donnée dans la table suivante:
Table 4.1.1. Grandeur en cm d’une population de 5 individus
Individu Grandeur (cm)
\(x_1\) 185
\(x_2\) 175
\(x_3\) 155
\(x_4\) 165
\(x_5\) 195
(a)
Calculer la moyenne et l’écart type de cette population.
(b)
Il existe \(31\) échantillons différents de cette population. Par exemple, il y a \({5\choose 2}=10\) échantillons de taille \(2\text{.}\) Chacun de ces échantillons produit une moyenne et un écart type qui diffère possiblement des valeurs calculées dans la question précédente. On s’intèresse au comportement de la moyenne échantillonnale en ce qui a trait à la taille de l’échantillon choisi. Compléter les données manquantes dans la table suivante. Les deux dernières lignes représentent la moyenne et l’écart type des moyennes des échantillons pour une taille donnée.
Faire les calculs à l’aide d’un logiciel ou d’une calculatrice.
Table 4.1.2. Moyennes échantillonnales de tous les échantillons possibles
\(n=1\) \(n=2\) \(n=3\)
Échantillons \(\bar{x}\) Échantillons \(\bar{x}\) Échantillons \(\bar{x}\)
\(\{x_1\}\) \(185\) \(\{x_1,x_2\}\) \(180\) \(\{x_1,x_2,x_3\}\) \(171,67\)
\(\{x_2\}\) \(175\) \(\{x_1,x_3\}\) \(170\) \(\{x_1,x_2,x_4\}\) \(175\)
\(\{x_3\}\) \(155\) \(\{x_1,x_4\}\) \(175\) \(\{x_1,x_2,x_5\}\) \(185\)
\(\{x_4\}\) \(165\) \(\{x_1,x_5\}\) \(190\) \(\{x_1,x_3,x_4\}\)
\(\{x_5\}\) \(195\) \(\{x_2,x_3\}\) \(\{x_1,x_3,x_5\}\)
\(\{x_2,x_4\}\) \(\{x_1,x_4,x_5\}\)
\(\{x_2,x_5\}\) \(\{x_2,x_3,x_4\}\)
\(\{x_3,x_4\}\) \(\{x_2,x_3,x_5\}\)
\(\{x_3,x_5\}\) \(\{x_2,x_4,x_5\}\)
\(\{x_4,x_5\}\) \(\{x_3,x_4,x_5\}\)
Moyenne \(\mu_{\overline{X}}\) \(\) Moyenne \(\mu_{\overline{X}}\) Moyenne \(\mu_{\overline{X}}\)
Écart type \(\sigma_{\overline{X}}\) \(\) Écart type \(\sigma_{\overline{X}}\) Écart type \(\sigma_{\overline{X}}\)
Table 4.1.3. Moyennes échantillonnales de tous les échantillons possibles
\(n=4\) \(n=5\)
Échantillons \(\bar{x}\) Échantillons \(\bar{x}\)
\(\{x_1,x_2,x_3,x_4\}\) \(170\) \(\{x_1,x_2,x_3,x_4,x_5\}\) \(175\)
\(\{x_1,x_2,x_3,x_5\}\) \(177,5\)
\(\{x_1,x_2,x_4,x_5\}\)
\(\{x_1,x_3,x_4,x_5\}\)
\(\{x_2,x_3,x_4,x_5\}\)
Moyenne \(\mu_{\overline{X}}\) Moyenne \(\mu_{\overline{X}}\)
Écart type \(\sigma_{\overline{X}}\) Écart type \(\sigma_{\overline{X}}\)
(c)
Formuler des observations sur le comportement de \(\overline{X}\) par rapport à la taille de l’échantillon.

2.

On regarde les notes finales de tous les élèves qui suivent un cours de probabilités et statistique. On considère aussi la moyenne finale de tous les groupes de ce même cours. Laquelle de ces deux variables aléatoires devrait posséder la plus grande variabilité? Comparer la réponse à cette question avec les observations de la question 1.

3.

Télécharger et ouvrir le fichier Bixi_août_2016.xlsx disponible à l’adresse suivante
 3 
github.com/JeanSebastienTurcotte/LabosStats/blob/main/assets/Base%20de%20donn%C3%A9es/Bixi_ao%C3%BBt_2016.xlsx?raw=true
. Ce fichier contient une feuille de calcul appelée «Trajets en BIXI août 2016», laquelle contient quatre variables et \(688174\) données, représentant l’ensemble de tous les trajets effectués en Bixi à Montréal durant le mois d’août 2016. On considère ces trajets comme la population à l’étude.
(a)
Dans la feuille de calcul Trajets en BIXI août 2016, nommer le tableau des données ainsi que ses colonnes, tel que montré à la Sous-section 1.2.3. Créer ensuite une deuxième feuille de calculs intitulée «Échantillonnage_canevas». Déplacer cette feuille de calcul à la gauche de la première. Cela évitera plus tard de la sélectionner par erreur.
(b)
Faire l’étude descriptive de la population telle que décrite dans la Sous sous-section 3.2.1.6. À la vue de ces mesures, est-ce qu’on peut qualifier la distribution d’à peu près normale? Expliquer.