Sauter au contenu
Logo image

Section 2.2 Laboratoire

Dans ce laboratoire, on cherche à représenter la répartition du nombre de femmes d’origine pima vivant en Arizona qui sont atteintes du diabète, ainsi que leur répartition selon leur niveau d’obésité, tel que qualifié par Santé Canada en fonction de l’indice de masse corporelle.
Pour cela, on utilise les variables Atteint et Obésité, dont les tableaux croisés dynamiques ont été construits respectivement au Laboratoire 1 et à l’exercice préparatoire. On rappelle que, pour la variable Atteint, le code \(0\) signifie l’absence de diabète et le code \(1\) signifie que la femme est atteinte du diabète. Pour la variable Obésité, l’échelle de \(1\) à \(6\) se traduit par:
  1. Poids insuffisant;
  2. Poids normal;
  3. Excès de poids;
  4. Obésité classe I;
  5. Obésité classe II;
  6. Obésité classe III.
Dans ce laboratoire, on introduit la notion de mise en forme d’un tableau à des fins de publication, la création d’un diagramme circulaire et d’un diagramme à bandes, ainsi que la mise en forme appropriée pour ces deux éléments graphiques.

Sous-section 2.2.1 Exercice préparatoire

Avant chaque laboratoire, on cherche à consolider les notions abordées dans les laboratoires précédents et à préparer les fichiers de travail. Pour préparer ce laboratoire, on poursuit l’étude des données diagnostiques de 768 femmes d’origine pima de l’Arizona à partir de la base de données du laboratoire d’introduction 1.
Dans le fichier Excel du laboratoire 1 (Données_Diabète.xlsx), créer une nouvelle feuille de calcul intitulée Étude Obésité. Dans celle-ci, générer le tableau croisé dynamique de la répartition des femmes selon la variable Obésité.

Sous-section 2.2.2 Tableau d’une variable qualitative

Les étapes de l’analyse d’une variable qualitative sont les suivantes : filtrage de données aberrantes, création du tableau croisé dynamique, mise en forme de ce tableau croisé dynamique, création d’un graphique approprié, tel qu’un diagramme circulaire ou un diagramme à bandes verticales ou horizontales, calcul de quelques mesures descriptives comme le mode, et enfin, interprétation des résultats. Les étapes qui suivent mènent à l’analyse de la présence de diabète chez les 768 femmes d’origine pima de l’échantillon.

Sous sous-section 2.2.2.1 Le tableau croisé dynamique

La première étape de l’étude d’une variable qualitative est la création d’un tableau croisé dynamique. Les étapes menant à la construction du tableau de la répartition des femmes selon la présence de diabète ont été présentées à la fin du laboratoire 1 (voir la Sous-section 1.2.6).

Sous sous-section 2.2.2.2 Le tableau pour publication

Le tableau croisé dynamique construit par Excel à la fin du laboratoire 1 n’est pas adéquat si l’on souhaite le publier comme source d’information. Par exemple, il est nécessaire de préciser le nom des catégories, d’ajouter un titre significatif et la source des données. Les étapes suivantes mènent à la construction d’un tableau plus propice au partage des informations.
Première méthode.
  1. Dans la feuille Étude Atteint, sélectionner la cellule G3 pour commencer le tableau (voir la Figure 2.2.1).
  2. Appuyer ensuite sur la touche = (voir la Figure 2.2.1).
  3. Sélectionner la plage du tableau croisé dynamique correspondant aux données, soit les cellules C4:D6. Appuyer sur la touche Enter.
  4. Il est possible qu’il faille changer le format de la cellule pour Pourcentage (voir Format de cellule en pourcentage). On s’assure de garder deux chiffres significatifs après la virgule. L’animation ci-dessous permet de voir à quoi ressemble la progression de ces étapes.
    Animation de la copie des données du tableau croisé dynamique vers un tableau pour présentation - première méthode
    Figure 2.2.1. Création du tableau pour présentation - première méthode
Deuxième méthode.
Il existe une autre méthode pour copier les valeurs d’un tableau croisé dynamique. Les étapes sont présentées ci-dessous.
  1. Dans la feuille Étude Atteint, sélectionner les cellules C4:D6 (voir la Figure 2.2.2).
  2. Appuyer sur les touches Ctrl+C pour copier les valeurs.
  3. Sélectionner la cellule G3, l’endroit où les cellules copiées seront collées.
  4. Appuyer sur les touches Ctrl+V pour copier les valeurs (voir la Figure 2.2.2).
  5. Cliquer sur l’icône de collage spécial situé dans le coin inférieur bas et sélectionner Coller le lien (N) (voir la Figure 2.2.2).
  6. Il est possible qu’il faille changer le format de la cellule pour Pourcentage (voir Format de cellule en pourcentage). On s’assure de garder deux chiffres significatifs après la virgule. L’animation ci-dessous permet de voir à quoi ressemble la progression de ces étapes.
    Animation de la copie des données du tableau croisé dynamique vers un tableau pour présentation - deuxième méthode
    Figure 2.2.2. Création du tableau pour présentation - deuxième méthode

Sous sous-section 2.2.2.3 Mise en forme d’un tableau

Une fois les données extraites du tableau croisé dynamique, on ajoute les étiquettes de colonnes et de lignes, le titre du tableau et la source des données. Pour le moment, on ne se soucie pas de la mise en forme de ces éléments. Dans un premier temps, pour le tableau concernant la variable Atteint du diabète, les étapes qui suivent devraient mener à un tableau de quatre lignes et trois colonnes.
Liste 2.2.3. Mise en forme du tableau pour publication
  1. Dans la cellule F3, on ajoute une colonne appelée «Présence du diabète» dont les lignes sont, du haut vers le bas : «Non»,«Oui»,«Total». La colonne «Présence du diabète» se trouve donc dans la colonne F de la feuille de calcul.
  2. On ajoute le titre des autres colonnes, de gauche à droite : «Nombre de femmes» (cellule G3) et «Pourcentage de femmes» (cellule H3). On élargit les colonnes de manière à ce que le tout soit lisible.
  3. Dans la dernière ligne, soit la ligne \(6\text{,}\) on a le total du nombre de femmes sous chaque colonne. Sous la colonne Pourcentage de femmes à la ligne Total, on s’assure qu’il est toujours écrit \(100\%\text{,}\) même si l’addition des nombres dans la colonne pourrait ne pas donner \(100\%\) en raison d’erreur d’arrondi. Dans de tels cas, on l’indiquera sous le tableau à l’aide de la note : «En raison de l’arrondissement des pourcentages, le total pourrait ne pas être exactement de \(100,00\%\text{.}\)»
  4. Sous le tableau, on inscrit la source des données. Dans le cas de cette étude, la source est donnée dans la Section 1.1. La mention «Source : National Institute of Diabetes and Digestive and Kidney Diseases (USA)» doit apparaitre sous chacun des tableaux et des graphiques créés pour publication.
  5. On titre le tableau. Le titre aura généralement la forme Répartition d’un échantillon (ou d’une population) de [unités statistiques] selon [la variable], [le lieu], [période ou date]. Écrire ce titre dans la cellule F1.
  6. Le titre étant long, on aimerait le centrer au tableau. Sélectionner les cellules F1:H2 (voir la Figure 2.2.4).
  7. Cliquer sur l’onglet Accueil Dans le groupe Alignement, sélectionner l’option Fusionner et centrer (voir la Figure 2.2.4). Les cellules F1:H2 sont maintenant considérées comme une seule cellule.
  8. Le titre est cependant sur une ligne. On aimerait qu’il soit sur plus d’une ligne pour qu’il soit lisible. Dans le groupe Alignement, sélectionner l’option Renvoyer à la ligne automatiquement (voir la Figure 2.2.4). On peut mettre le titre en gras et augmenter la police si l’on veut.
    Capture d’écran du tableau une fois les étapes précédentes effectuées.
    Figure 2.2.4. Le tableau pour publication - après la mise en forme
Répéter les étapes ci-dessus avec le tableau croisé dynamique généré lors du prélaboratoire pour la variable Obésité dans la feuille Étude Obésité.
Ces tableaux sont appelés tableau de fréquences de la variable étudiée. S’il n’y a que la colonne du nombre d’individus, on parle alors de tableau de fréquences absolues et, s’il n’y a que la colonne des pourcentages, on dit tableau de fréquences relatives.
Habituellement, le titre, les entêtes de colonne, ainsi que le contenu de la ligne «Total» ont une mise en forme particulière, par exemple en gras.

Sous-section 2.2.3 Graphiques d’une variable qualitative

Un tableau est une excellente manière de rassembler l’information d’une variable qualitative. Cela dit, illustrer la répartition des unités de manière graphique peut être aussi, et même davantage, utile. Pour une variable qualitative, il existe deux types de graphiques principaux: le diagramme circulaire et le diagramme à bandes. Dans le second cas, les bandes peuvent être horizontales ou verticales, mais, si la variable est ordinale, on préfère le diagramme à bandes verticales.

Sous sous-section 2.2.3.1 Diagramme circulaire

On construit le diagramme circulaire associé à la variable Atteint. On choisit de faire la répartition en pourcentage des effectifs.
  1. Dans le tableau de fréquences de la feuille Étude Atteint, sélectionner les modalités de la variable aux cellules F4:F5 et, en maintenant la touche Ctrl enfoncée, les effectifs relatifs aux cellules H4:H5.
  2. Cliquer sur l’onglet Insertion du ruban (voir la Figure 2.2.5).
  3. Sous l’onglet Insertion, cliquer sur l’icône correspondant au diagramme circulaire dans le ruban (voir la Figure 2.2.5).
  4. Sous Secteur 2D, cliquer sur le premier type de graphique à gauche, appelé Secteur (voir la Figure 2.2.5). Le graphique créé sera inséré dans la feuille. Déplacer le graphique au besoin.
    La figure Figure 2.2.5 illustre les étapes précédentes sous forme d’animation.
    Animation des étapes menant à l’insertion d’un diagrame circulaire.
    Figure 2.2.5. L’insertion d’un diagramme circulaire
  5. On peut sélectionner un style prédéfini sous l’onglet création de graphique (apparaissant lorsque le graphique est sélectionné, voir la figure Figure 2.2.6) ou encore peaufiner les éléments graphiques selon ce qui est attendu. Toutefois, en sciences, l’allure esthétique du graphique ne devrait pas prendre le dessus sur l’information transmise. On préfèrera un style relativement neutre sans trop de fioritures. Le graphique circulaire doit contenir les éléments suivants:
    • Un titre représentatif, typiquement de la forme Répartition d’un échantillon (ou d’une population) de [unités statistiques] selon [la variable], [le lieu], [période ou date];
    • Une légende, pour distinguer les différents secteurs;
    • Les étiquettes correspondant aux pourcentages ou au nombre d’effectifs sur le graphique, pour une information précise;
    • La source, lorsque pertinente, dans le bas du graphique.
    Si l’un ou plusieurs de ces éléments est manquant, on peut, lorsque le graphique est sélectionné, cliquer sur l’onglet Création de graphique et cliquer sur le bouton Ajouter un élément graphique situé dans la partie gauche du ruban. Il est aussi possible de cliquer sur le petit symbole de croix en haut à droite du graphique. La figure Figure 2.2.7 illustre ces deux options.
Capture d’écran de l’endroit où l’on retrouve les styles prédéfinis dans le ruban
Figure 2.2.6. Les styles prédéfinis d’Excel
Capture d’écran de l’endroit dans le ruban où l’on peut ajouter une élément graphique.
Capture d’écran de l’endroit dans près du graphique où l’on peut ajouter une élément graphique.
Figure 2.2.7. Ajout d’un élément graphique: deux options

Sous sous-section 2.2.3.2 Diagramme à bandes

On construit maintenant le diagramme à bandes pour la variable Obésité. Comme la variable est qualitative et a une échelle ordinale, on choisit les bandes verticales. On choisit d’utiliser les effectifs relatifs.
  1. Dans le tableau de fréquences de la feuille Étude Obésité, sélectionner les modalités de la variable et, en maintenant la touche Ctrl enfoncée, les effectifs relatifs.
  2. Sous l’onglet Insertion, cliquer sur le bouton correspondant à l’histogramme. Voir la figure Figure 2.2.8 ci-dessous.
    • Sous Histogramme 2D, cliquer sur le premier type de graphique à gauche, appelé Histogramme groupé, pour un diagramme à bandes verticales.
    • Sous Barres 2D, cliquer sur le premier type de graphique à gauche, appelé Barres groupées, pour un diagramme à bandes horizontales.
      Capture d’écran de l’emplacement pour ajouter un diagramme à bandes
      Figure 2.2.8. Insertion d’un diagramme à bandes
  3. On peut sélectionner un style prédéfini ou encore peaufiner les éléments graphiques selon ce qui est attendu. Toutefois, en sciences, l’allure esthétique du graphique ne devrait pas prendre le dessus sur l’information transmise. On préfèrera un style relativement neutre sans trop de fioritures. Le diagramme à bandes doit contenir les éléments suivants:
    • Un titre représentatif, typiquement de la forme Répartition d’un échantillon (ou d’une population) de [unités statistiques] selon [la variable], [le lieu], [période ou date];
    • Des titres significatifs pour les axes;
    • Le nom des modalités identifié clairement, sous l’axe (pour un graphique à bandes verticales), à la gauche (pour un graphique à bandes horizontales) ou encore dans une légende (pour les deux types de graphiques).
    • L’axe des effectifs comprend une graduation bien faite. Une note est ajoutée s’il y a eu coupure de l’axe pour sauter certaines valeurs.
    • Les étiquettes correspondant aux pourcentages ou au nombre d’effectifs sur le graphique, pour une information précise.
    • La source, lorsque pertinente, dans le bas du graphique.
    Si l’un ou plusieurs de ces éléments sont manquants, on peut, lorsque le graphique est sélectionné, cliquer sur l’onglet Création de graphique et cliquer sur le bouton Ajouter un élément graphique. Il est aussi possible de cliquer sur le petit symbole de croix en haut à droite du graphique. La figure Figure 2.2.7 illustre ces deux options.
Le résultat attendu du diagramme à bandes vertical
Figure 2.2.9. Diagramme à bandes verticales