Avant de commencer à utiliser un nouveau logiciel, il est essentiel de se familiariser avec son interface et ses outils. Les fichiers d’Excel sont appelés des classeurs et chaque classeur contient des feuilles de calcul. La Figure 1.2.1 présente les noms des différents éléments d’une feuille d’Excel.
La barre Accès rapide est une barre personnalisable qui affiche les icônes des commandes les plus courantes. Par défaut, elle comprend les commandes suivantes : l’enregistrement de fichier, l’annulation d’une action effectuée et le rétablissement d’une action annulée.
Le nom du classeur est écrit dans la barre d’Accès rapide. Par défaut, Excel nomme le fichier Classeur 1. Les versions plus récentes d’Excel permettent de sauvegarder automatiquement le travail fait.
Le ruban est composé d’une barre de menus (Fichier, Accueil, Insertion, Mise en page, Formules, Données, Affichage, entre autres) et d’un groupe de commandes courantes dans chaque menu (outils courants regroupés par nature dans chaque onglet).
Une feuille de calcul est un quadrillage comportant des cases, appelées cellules, dans lesquelles on peut écrire du texte ou effectuer des calculs à l’aide de formules et de fonctions.
La cellule de référence C5 est la cellule située à l’intersection de la colonne C et de la ligne 5 . C5 est l’adresse de la cellule. Une cellule est dite active lorsqu’elle est sélectionnée. Dans ce cas, sa bordure est verte et épaisse. Les entêtes de sa colonne et de sa ligne sont alors grisés.
La zone nom permet d’afficher la référence d’une cellule (la lettre de sa colonne et le numéro de sa ligne) ou le nom qui lui a été attribué. Cette zone permet également d’afficher le nom d’une plage de données.
La barre de formule permet d’afficher, d’entrer ou de modifier le contenu d’une cellule active. Le contenu peut être composé de texte, de nombres, de formules ou de fonctions.
Les onglets de feuilles représentent l’ensemble des feuilles de calcul qui composent le classeur. En cliquant droit sur l’onglet d’une feuille, un menu contextuel apparait. Il est possible, entre autres, de renommer la feuille, de la déplacer, de la copier, de la masquer ou de la supprimer.
Placer le curseur sur le numéro de la ligne à sélectionner jusqu’à ce qu’une flèche noire apparaisse au-dessus du numéro de la ligne (voir la Figure 1.2.2).
Pour la sélection d’une colonne entière, la procédure est similaire. Il faut placer le curseur sur la lettre de la colonne à sélectionner, attendre l’apparition de la flèche noire et cliquer.
Cliquer et déplacer la flèche vers la gauche pour rétrécir la largeur de la colonne de gauche et vers la droite pour élargir la largeur de la colonne de gauche. Pour modifier la largeur d’une ligne, il faut placer le curseur entre deux lignes et déplacer la flèche vers le haut ou le bas selon le résultat souhaité.
Il est possible d’ajuster la largeur d’une colonne ou d’une ligne au contenu de celle-ci. Il suffit de doublecliquer lorsque la flèche bidirectionnelle apparait.
Dans cette section, les étapes pour nommer des cellules sont présentées. Attribuer un nom à une cellule signifie lui donner un identifiant autre que son adresse, afin de pouvoir y faire référence dans toutes les feuilles de calcul d’un classeur Excel.
Sous sous-section1.2.3.1Attribuer un nom à une cellule ou à une plage de cellules
La sélection de données est une opération courante dans Excel. En effet, que ce soit pour l’utilisation de formules ou la création de graphiques, il est souvent nécessaire de sélectionner des cellules. Cette tâche peut être laborieuse lorsque la base de données est volumineuse : on risque de glisser trop loin avec la souris, de devoir revenir en arrière, de ne pas sélectionner suffisamment de cellule et d’omettre des données, etc. Pour éviter ces problèmes, il est pratique d’attribuer un nom à une cellule ou à une plage de cellules. Cela permet de faire référence à ce nom dans une formule, peu importe la feuille de calcul dans laquelle on travaille.
Dans la feuille de calcul Données du fichier Excel, on attribue un nom au tableau principal, soit le nom « Échantillon ». Il existe deux façons d’effectuer cette opération. La première méthode est présentée ci-dessous et est celle privilégiée. La deuixème méthode est présentée en annexe (voir la Appendice F).
Sélectionner l’entièreté du tableau, soit la plage A5:K773. Il est possible de faire ceci en sélectionnant la cellule A5 et en tapant la combinaison Ctrl+A.
Dans la zone nom (voir la Figure 1.2.1), taper le mot Échantillon (voir la Figure 1.2.4) et appuyer sur la touche Enter. Les noms ne doivent pas contenir d’espace ni de caractères spéciaux.
Lorsque l’on attribue un nom à une plage de cellules avec la première méthode, il ne faut pas oublier d’appuyer sur la touche Enter pour s’assurer de l’enregistrement du nom.
Il est pratique d’attribuer un nom aux colonnes d’un tableau puisqu’il est possible de faire référence à celles-ci dans des formules Excel, et ce, peu importe la feuille de calcul dans laquelle on travaille.
Dans Excel, il est possible d’ajouter des filtres permettant de dépister des valeurs aberrantes ou manquantes, ainsi que de choisir ou masquer certaines modalités. Il est également possible de trier des séries statistiques dans un certain ordre voulu.
En cliquant sur ce triangle, toutes les modalités d’une variable qualitative et toutes les valeurs d’une variable quantitative sont affichées (voir la Figure 1.2.14). Il est possible de décocher certaines catégories pour les masquer et n’afficher que celles souhaitées.
En cliquant sur le petit triangle de filtre de la variable Âge, une boite de dialogue s’ouvre. La première option permet de trier les valeurs par ordre croissant (plus petit au plus grand, A à Z pour les variables qualitatives), tandis que la deuxième option permet de trier les valeurs par ordre décroissant (du plus grand au plus petit, Z à A pour les variables qualitatives) (voir la Figure 1.2.15).
Il est possible de sélectionner la variable à trier et d’appliquer un tri croissant, un tri décroissant ou un tri personnalisé (voir la Figure 1.2.17).
Lorsqu’on réalise plusieurs études à partir d’une même base de données, il est préférable de travailler dans un seul classeur et d’effectuer chaque étude dans une feuille de calcul distincte afin de faciliter la consultation.
Lorsque l’on dispose d’une vaste base de données, il peut être difficile de mettre en évidence les faits saillants. Excel permet de créer des tableaux croisés dynamiques pour organiser, présenter, synthétiser et analyser des données. Pour ce faire, il est crucial que les données de chaque variable soient initialement organisées en colonnes dans un seul tableau maitre. Le mot « croisé » fait référence à la possibilité de regrouper et de comparer plusieurs variables, tandis que le mot « dynamique » souligne la capacité du tableau à évoluer. En effet, si une valeur est modifiée dans la base de données, le tableau croisé dynamique peut être mis à jour. À partir d’un tableau croisé dynamique, il est possible de générer un tableau de fréquences pour visualiser la répartition des unités statistiques en fonction d’une variable.
La première enquête du laboratoire 2 porte sur la répartition des femmes d’origine pima de l’Arizona selon la présence de diabète. Ainsi, on génère un tableau croisé dynamique de cette distribution. Il existe deux méthodes pour le générer.
Dans la feuille Données, sélectionner l’entièreté du tableau, soit la plage A5:K773. Il est possible de faire ceci en sélectionnant une cellule non vide du tableau Échantillon et en tapant la combinaison Ctrl+A.
Figure1.2.26.Sélection de la plage de données à partir de laquelle un tableau croisé dynamique sera généré et sélection de l’option Feuille de calcul existante et de la flèche pour l’emplacement du tableau croisé dynamique
Une fois le tableau croisé dynamique généré, il faut le configurer. À la droite de la feuille de calcul, les champs du tableau croisé dynamique s’affichent. Les champs correspondent aux entêtes des colonnes du tableau source. On trouve cinq encadrés : le premier contient les champs. Les encadrés Colonnes, Lignes et Valeurs représentent des zones où l’on peut ajouter des champs. L’encadré Valeurs permet d’effectuer des calculs au sein du tableau croisé dynamique, tandis que l’encadré Filtres sert à appliquer des filtres aux données lors de la création du tableau.
Avec 768 femmes étudiées, il est évident qu’un décompte manuel des femmes diabétiques est à la fois long, laborieux et sujet à de nombreuses erreurs. Les étapes pour créer le tableau croisé dynamique de la répartition des femmes pima selon la présence de diabète sont présentées ci-dessous.
Glisser et déposer la variable Atteint dans la zone de saisie Lignes (voir la Figure 1.2.29). Pour ce faire, il faut cliquer sur la variable Atteint avec le bouton de gauche de la souris, garder son doigt enfoncé et glisser la variable dans la zone Lignes.
Par défaut, Excel effectue la somme des valeurs comme opération. Cependant, on veut compter le nombre de femmes dans chaque catégorie. Dans la zone de saisie Valeurs, cliquer sur la flèche du menu déroulant, puis sélectionner l’option Paramètres des champs de valeurs (voir la Figure 1.2.31) pour modifier le calcul.
Cette action ajoute une deuxième colonne au tableau croisé dynamique, une colonne qui compte le nombre de femmes d’origine pima dans chaque catégorie de la variable Atteint (voir la Figure 1.2.33).
Répéter l’étape 2 pour ajouter une troisième colonne au tableau croisé dynamique. On veut ajouter une colonne pour le pourcentage de femmes d’origine pima atteintes ou non du diabète.
Cliquer avec le bouton de droite de la souris sur une des colonnes du tableau croisé dynamique. Un menu déroulant s’affiche. Cliquer l’option Actualiser.
Dans le prochain laboratoire seront abordées les étapes pour améliorer la présentation de ce tableau afin qu’il soit conforme aux normes statistiques .
Lorsqu’on souhaite parcourir un tableau de grande taille (beaucoup de lignes ou de colonnes), il est pratique de maintenir les titres des colonnes ou des lignes visibles pendant le défilement de la feuille de calcul.
Sous sous-section1.2.7.1Figer la ligne de titres d’un tableau
Dans la feuille de calcul Données du fichier Excel, sélectionner la deuxième ligne du tableau, soit la ligne 6 (voir la Figure 1.2.37). Il faut placer son curseur à la ligne 6 et cliquer.
Maintenant, lorsque l’on fait défiler le tableau, les titres des colonnes restent visibles. Il est possible de verrouiller à la fois des lignes et des colonnes, ainsi que de libérer les volets, si nécessaire.
Dans le groupe Fenêtre, cliquer sur la flèche du menu déroulant de l’icône Figer les volets (voir la Figure 1.2.40). Cliquer sur l’option Libérer les volets.