Section 6.1 Prélab
Dans une recherche scientifique, la première étape consiste à planifier l’étude. Cela inclut la revue du contexte théorique, la formulation des questions et des hypothèses de recherche, la définition des unités statistiques ainsi que des variables à étudier, le choix de la méthode d’échantillonnage et de l’outil de collecte de données.
Ensuite, la collecte de données est effectuée à l’aide de l’outil de collecte approprié. Une fois les données récoltées, il convient de les organiser et de les traiter.
Le but ultime d’une étude scientifique est de répondre aux questions de recherche en généralisant les résultats d’un échantillon à la population. Les résultats observés dans l’échantillon révèlent-ils un changement dans le comportement de la population, ou sont-ils simplement dus au hasard de l’échantillonnage? Dans les laboratoires 1, 2 et 3, il a été question de traitement et d’organisation de données. La prochaine étape de la recherche consiste à réaliser des tests d’hypothèse paramétriques, notamment des tests d’hypothèse sur une moyenne, des tests sur une proportion, des tests de comparaison entre deux moyennes et des tests de comparaison entre deux proportions. Ce sera l’occasion de se familiariser avec des canevas Excel fournis et de comprendre les subtilités des tests d’hypothèses paramétriques.
Feuille d'activités Travail à faire avant le cours
Objectifs
Examiner des séries statistiques.
Effectuer une revue de la littérature.
Poser un regard critique sur des données.
Formuler des hypothèses de recherche.
Se questionner sur la généralisation des mesures échantillonnales à la population.
1.
Une enseignante veut effectuer une expérience en classe avec ses élèves. Dans sa main se trouve un petit sac noir. Elle indique aux élèves que le sac contient six billes, quatre billes bleues et deux billes vertes. Ensemble, ils vont réaliser une expérience aléatoire qui consiste à piger avec remise six billes du sac. On s’intéresse au nombre de billes bleues pigées. À tour de rôle, la personne enseignante fait piger une bille par un élève. À la fin du tirage, six billes vertes ont été pigées. Ce résultat peut être vu comme le résultat du prélèvement d’un échantillon aléatoire. Piger six billes vertes, est-ce un résultat attendu? Sur quoi faut-il se baser pour répondre à cette question? À quoi compare-t-on la valeur échantillonnale?
2.
Justifier la réponse de l’exercice
1 avec les calculs appropriés (cote z ou probabilité d’obtenir un tel résultat, soit piger six billes vertes).
3.
À la lumière des réflexions des exercices
1 et
2, quelles sont les deux conclusions possibles? Laquelle vous semble la plus probable?
4.
Une enseignante veut effectuer une expérience en classe avec ses élèves. Elle donne à chaque élève un dé à six faces. Elle souhaite savoir quels dés sont truqués (pipés). Pour le déterminer, les élèves doivent les lancer plusieurs fois et noter la distribution des résultats obtenus. Lors de l’élaboration d’un test d’hypothèse, il faut formuler une hypothèse de base et une hypothèse alternative. L’hypothèse de base, soit \(H_{0}\text{,}\) communément appelée l’hypothèse nulle, est un énoncé à tester partant de l’idée qu’il n’y a pas de différence significative dans le paramètre mesuré ou de l’idée que la distribution obtenue se répartit selon un modèle théorique connu. L’hypothèse alternative est l’énoncé contraire à l’hypothèse nulle, soit qu’il y a une différence dans le paramètre mesuré. Dans ce scénario, pourquoi est-ce que l’hypothèse nulle serait que le dé n’est pas pipé. Pourquoi est-ce que l’hypothèse alternative serait que le dé est pipé? Expliquer.
5.
La quantité moyenne quotidienne de précipitations totales reçues au courant du mois de mars à Montréal entre 1991 et 2020 est de
\(2,49\) mm par jour. Cependant, ces dernières années, de nombreux Montréalais ont l’impression que les précipitations mensuelles sont en baisse ( ). Pour vérifier cette hypothèse, on souhaite réaliser un test d’hypothèse sur une moyenne en se basant sur les données échantillonnales d’Environnement Canada pour le mois de mars 2024 (voir la
Section A.6) pour vérifier si la quantité moyenne de précipitations a diminué. On a obtenu une valeur de
\(1,93\) mm par jour. Il se peut que l’échantillon prélevé a donné une moyenne un peu plus basse que le paramètre de la population. C’est ce qu’on appelle la variabilité échantillonnale. Chaque échantillon donne une moyenne différente et rarement égale à la moyenne de la population. Il se peut que la différence ne soit pas simplement due au hasard de l’échantillonnage. Sans faire de calculs, est-ce que la différence entre
\(2,49\) mm (
\(\mu\)) et
\(1,93\) mm (
\(\bar{x}\)) paraît grande à première vue, et donc significative? Justifier ce choix.