Créer un histogramme avec Excel
Vous savez à quoi ressemble un graphique à barres, mais le dessiner est une autre histoire... Les histogrammes permettent de représenter la distribution de la fréquence dans un groupe de données. Cette initiative est plutôt laborieuse lorsque l’on utilise des formules mathématiques, alors pourquoi ne pas tirer parti d’un outil à portée de main ? Avec Excel, créer un histogramme est un jeu d’enfant. Nous vous expliquons comment procéder.
Qu’est-ce qu’un histogramme ?
Un histogramme représente la distribution de la fréquence, ce qui explique son utilisation très répandue en statistiques. Les graphiques de ce type permettent de lire la fréquence d’une donnée dans une catégorie particulière (groupe de données), aussi bien grâce à la largeur des barres que grâce à leur hauteur. La largeur des barres renseigne sur la grandeur de la catégorie, et c’est là un des avantages de l’histogramme : au moment de créer le graphique, on peut déterminer la grandeur de chaque catégorie.
Exemple : partons du principe que vous souhaitiez représenter les résultats d’un concours de lancer de poids lors d’un événement sportif pour enfants sous la forme d’un histogramme. Les responsables ont bien sûr mesuré différentes longueurs pour les lancers. Vous voulez maintenant présenter ces données avec un graphique. Vous répartissez les valeurs dans différentes catégories. Celles-ci ne doivent pas être égales : la largeur de chaque barre montre de façon explicite l’importance de chaque catégorie.
Il est toutefois recommandé de privilégier l’homogénéité du graphique, notamment pour la zone médiane, afin de renforcer sa lisibilité. Une catégorie peut par exemple réunir les lancers entre 30 et 34 mètres. Il s’agit alors de répartir les valeurs dans les catégories et de définir ainsi la fréquence de ces dernières.
Pour déterminer la hauteur des barres, nous devons calculer ce que l’on appelle la densité. Il convient de diviser le nombre de valeurs de la catégorie par la largeur de cette dernière. Dans notre exemple, pour la catégorie réunissant les valeurs de 30 à 34 mètres, la largeur est de 4 (soit un écart de 4 mètres). De 35 à 40 mètres, la largeur de catégorie est en revanche de 5.
Considérons que 8 enfants ont effectué un lancer de 30 à 34 mètres. La densité de la catégorie est donc de 2 (8 divisé par la largeur de catégorie, 4). On trace ainsi sur l’histogramme un rectangle de 4 de largeur par 2 de hauteur. Le lecteur peut alors déduire le nombre de valeurs à partir de la hauteur et de la largeur de la barre, puisqu’il suffit de multiplier les longueurs de deux côtés du rectangle.
Vous pouvez choisir vous-même le nombre de catégories et leur largeur respective. Cependant, choisissez vos valeurs de manière à transmettre des informations pertinentes avec votre graphique.
Créer un histogramme avec Excel : pas-à-pas
Lors de la création d’un histogramme, le tableur de Microsoft n’effectue pas tout le travail à votre place, mais vous fait gagner un temps considérable sur de nombreuses étapes. Pour y parvenir, Excel utilise un complément, c’est-à-dire une extension de ses fonctionnalités standard. Il s’agit ici de l’utilitaire « Analysis ToolPak ». Pour activer ce complément d’application (ou vérifier qu’il est bien activé), cliquez sur « Compléments » dans le menu Options. Il existe cependant d’autres méthodes pour représenter la distribution de fréquence avec Excel.
Créer un histogramme Excel – avec le complément
Une fois le complément activé, créez un tableau regroupant toutes vos valeurs dans une colonne et les catégories que vous avez définies dans une autre. Dans cette dernière, veillez à toujours indiquer une valeur maximale. Par conséquent, si vous souhaitez inclure toutes les valeurs comprises entre 30 et 34 dans une même catégorie, créez une catégorie 29 et une catégorie 34. Toutes les valeurs inférieures à 30 seront regroupées dans la première catégorie, tandis que toutes les valeurs supérieures seront classées dans une troisième catégorie.
À présent, utilisez le complément pour calculer la fréquence des catégories. Dans l’onglet « Données », cliquez sur le bouton « Utilitaire d’analyse ». Sélectionnez l’option « Histogramme » dans la liste qui s’affiche. Excel vous affiche alors un masque de saisie : dans la zone « Plage d’entrée », choisissez la colonne contenant les valeurs à répartir. La « Plage des classes » correspond à la plage de cellules contenant les catégories que vous avez définies. Si vous avez entré un titre dans la première cellule de chaque colonne, activez l’option « Intitulé présent ».
Une fois que vous aurez choisi où l’analyse des données doit être affichée (sur une feuille existante ou une nouvelle feuille), Excel établit pour vous un calcul de la fréquence. Ce nouveau tableau vous indique combien de valeurs sont réparties dans chaque catégorie. Pour créer l’histogramme correspondant, au moment de spécifier les données, vous devez activer l’option « Représentation graphique ». Cette fois, lorsque vous confirmez les entrées, Excel crée un histogramme en parallèle.
Cette méthode vous permet uniquement de créer un histogramme avec des intervalles de catégorie identiques, c’est-à-dire avec des barres de la même largeur. Cette méthode n’est pas adaptée pour une distribution avec différentes largeurs.
Histogramme avec l’option graphique
Excel peut créer un histogramme avec l’option graphique. Cette fonction vous propose d’autres méthodes pour définir la distribution de vos catégories. Pour pouvoir utiliser cette option, il vous faudra utiliser la liste de données originale. Sélectionnez cette plage de données puis, dans l’onglet « Insertion », rubrique « Graphiques », cliquez sur le bouton pour les histogrammes. Excel choisit automatiquement une distribution de catégories à partir de vos données. Cette méthode produit également des barres de la même largeur. Faites un clic droit sur l’axe X et sélectionnez l’option « Mise en forme de l’axe... » pour accéder aux options avancées de paramétrage de l’axe.
Lorsque vous utilisez cette méthode, vous créez l’histogramme exactement comme vous le feriez pour d’autres graphiques Excel.
Outre la distribution automatique, Excel vous propose deux méthodes alternatives qui nous intéressent ici : définir la largeur de catégorie (largeur du container), grâce à laquelle Excel calcule combien de catégories seront définies ; ou définir le nombre de catégories souhaitées, auquel cas le logiciel calculera automatiquement la largeur des barres. Vous pouvez aussi définir des valeurs maximales et minimales. Il s’agit de catégories qui délimitent plus précisément les limites de l’histogramme. Entrez les valeurs minimale et maximale que vous souhaitez voir apparaître dans les champs « Inférieur à cette valeur » et « Supérieur à cette valeur ». En fonction de l’ensemble de données, vous pouvez ainsi effectuer une distribution pertinente, catégorie par catégorie.
Créer un histogramme avec Excel affichant des barres de largeurs différentes
Pour afficher correctement la largeur d’une catégorie sur un graphique, il vous faudra faire preuve d’ingéniosité. Il n’existe pas de fonction standard pour ce type d’opération. L’astuce consiste à utiliser un tableau intermédiaire. Commencez par définir vous-même les catégories et leur largeur. À partir de cette largeur, calculez le plus grand commun diviseur. Vous devez ensuite calculer combien de fois ce diviseur apparaît dans chacune des catégories. Utilisez à nouveau l’Utilitaire d’analyse pour calculer la fréquence des données.
Pour calculer le plus grand commun diviseur de différentes valeurs, utilisez la formule Excel « =PGCD ».
Créez maintenant votre tableau intermédiaire : si, par exemple, une de vos catégories contient deux fois le plus grand commun diviseur, faites apparaître deux fois cette catégorie dans le tableau. Si elle contient trois fois le plus grand commun diviseur, faites-la apparaître trois fois. Ainsi, le graphique reflétera la fréquence d’une catégorie, tandis que les valeurs resteront inchangées.
Ce tableau vous permet de créer un graphique à colonnes. Le graphique montre à présent plusieurs barres de la même hauteur côte à côte. Vous devez maintenant adapter le format du graphique. Commencez par faire un clic droit sur une des barres et choisissez l’option « Mettre en forme le point de données... ». Dans ce volet, vous pouvez spécifier la largeur de l’intervalle. Placez le curseur sur 0 pour que les barres se touchent, ce qui n’est pas habituel pour un histogramme. Modifiez maintenant la couleur des barres pour que les colonnes identiques se détachent des autres. Votre histogramme est désormais tout à fait lisible !