Visualisation de données

Les méthodes graphiques sont souvent le meilleur moyen d’extraire les informations disponibles dans les données. Il existe de nombreuses techniques disponibles pour visualiser ces informations, en fonction de la nature des données. Statgraphics contient un large ensemble d’outils de visualisation, dont beaucoup avec des animations intégrées pour montrer comment les données changent au fil du temps.

Matrice de nuages de points

Cette procédure affiche une matrice de nuages de points pour trois variables numériques ou plus. La diagonale de cette matrice est constituée des boîtes à moustaches des différentes variables. La partie hors diagonale contient les nuages de points reliant deux variables pour chaque paire de variables. Cette procédure est très utile pour avoir un premier aperçu de données multivariées. Avec ce graphique, il est souvent possible de détecter des relations entre les variables, la présence de points extrêmes et d’autres caractéristiques intéressantes concernant les données.

Graphique en coordonnées parallèles

Cette procédure est une technique de visualisation multivariée qui peut être très utile pour identifier des différences et des similarités entre des sujets observés lorsque le nombre de dimensions est trop important pour utiliser de classiques nuages de points.

Graphique d’Andrews

Cette procédure est une technique de visualisation multivariée qui peut être très utile pour identifier des différences et des similarités entre des sujets observés lorsque le nombre de dimensions est trop important pour utiliser de classiques nuages de points.

Graphiques en étoiles et rayons de soleil

Un glyphe est une forme géométrique qui représente les valeurs de chacune des variables quantitatives. La taille du polygone dans chaque direction est mise à l’échelle en fonction de la valeur d’une variable spécifique. Les observations ayant des caractéristiques similaires auront des formes similaires.

Visages de Chernoff

Cette procédure est une technique de visualisation multivariée qui peut être très utile pour identifier des différences et des similarités entre des sujets observés lorsque le nombre de dimensions est trop important pour utiliser de classiques nuages de points.

Pyramide des âges

Cette procédure est conçue pour comparer les distributions de comptages de populations (ou de données similaires) de deux groupes. Elle peut être utilisée pour afficher les distributions à un unique instant de temps ou elle peut permettre de visualiser les modifications de ces distributions dynamiquement dans le temps. Dans ce cas, diverses options sont proposées pour lisser les données et pour gérer les données manquantes.

Diagramme en rose des vents

Cette procédure affiche des données dans un graphique circulaire permettant de visualiser la distribution des fréquences de variables telles que la vitesse du vent et sa direction. Elle peut être utilisée pour visualiser la distribution à un instant donné ou pour en afficher les évolutions temporelles de façon dynamique.

Graphique en violon

Cette procédure affiche les données quantitatives d’un unique échantillon en combinant une boîte à moustaches et une estimation non paramétrique de la densité. C’est un graphique très utile pour visualiser la forme de la fonction de densité de la population dont proviennent les données de l’échantillon.

Graphique en diamant

Cette procédure crée un graphique pour deux échantillons ou plus affichant les observations des échantillons ainsi que les intervalles de confiance des moyennes respectives des populations.

Carte thermique

Cette procédure affiche la distribution d’une variable quantitative pour toutes les combinaisons de deux facteurs qualitatifs. Si l’un des deux facteurs est un facteur temporel, alors les évolutions de la variable peuvent aisément être visualisées dans la carte. Un gradient de couleurs est utilisé pour représenter les valeurs de la variable quantitative.

Graphique en tournesols

Cette procédure est utilisée pour afficher un nuage de points X-Y lorsque le nombre d’observations est important. Pour éviter la superposition des symboles de points lorsqu’il y a un grand nombre de données, des glyphes ayant la forme de tournesols sont utilisés pour afficher le nombre d’observations dans de petites régions de l’espace X-Y.

Carte démographique (positions)

Cette procédure est conçue pour illustrer les évolutions de données statistiques pour des positions dans le temps. A partir de données dans k positions durant p périodes, le logiciel génère un affichage dynamique illustrant comment les données se modifient pour chaque position. Des applications graphiques typiques sont : population et autres mesures démographiques, indices relatifs à l’emploi, à la construction et autres indices économiques, statistiques environnementales. Les données pour chaque position sont affichées sous forme de bulles dont les tailles sont proportionnelles aux valeurs observées. Au travers de l’évolution temporelle, l’analyste peut visualiser les modifications dans les données pour chacune des positions. Diverses options sont proposées pour lisser les données et pour gérer les données manquantes.

Carte démographique (régions)

Cette procédure est conçue pour illustrer les modifications de statistiques temporelles associées à des zones géographiques. A partir de données pour chaque zone durant p périodes, le logiciel génère un affichage dynamique illustrant les évolutions temporelles des données dans chaque zone. Des applications graphiques classiques sont, par exemple, les évolutions de populations et autres mesures démographiques, taux de chômage, taux de construction et autres indices économiques, ventes trimestrielles de produits comme les automobiles. Chaque zone est affichée dans une couleur qui illustre le niveau de la statistique sélectionnée. Avec le temps, l’analyste peut visualiser les évolutions de cette statistique dans chaque zone. Différentes options sont proposées pour le lissage des données et pour la gestion des données manquantes.

Densité bivariée

Cette procédure affiche un histogramme des fréquences pour deux colonnes de données numériques. Elle est utile pour visualiser la distribution jointe de deux variables aléatoires. Les contrôles de la barre d’outils rendent aisé les modifications de la définition des classes groupant les données. La fonction de densité d’une loi normale bivariée, ayant les mêmes moyennes, les mêmes écarts-types et la même covariance que les données, est superposée à l’histogramme. De plus, une estimation non paramétrique de la densité peut être affichée.

Densité trivariée

Cette procédure affiche la fonction de densité estimée pour 3 colonnes de données numériques. Elle le fait soit sous la forme d’un graphique de contours à 3 dimensions soit sous la forme d’un graphique maillé à 3 dimensions. La distribution jointe des 3 variables peut être supposée être une loi normale multivariée ou estimée en utilisant une approche non paramétrique.

Visualiseur dynamique 1D

Cette procédure est conçue pour afficher graphiquement plusieurs séries temporelles de façon à aider les utilisateurs à visualiser les changements de ces variables dans le temps. A partir de n séries temporelles observées sur p périodes, le logiciel génère un affichage dynamique qui illustre comment chacune des variables évolue dans le temps. Des applications graphiques classiques sont : variables démographiques annuelles pour différents pays, ventes trimestrielles pour différentes divisions dans une entreprise, indices économiques mensuels pour différentes régions, cours de clôture journaliers pour différentes actions d’un portefeuille. Le graphique de base est un graphique en bulles affiché dans un repère X-Y. Les positions sur l’axe Y représentent les valeurs de la variable primaire de données. Les tailles et les couleurs des bulles peuvent être utilisées pour illustrer d’autres variables. Lorsque les périodes se modifient, l’analyste peut suivre les variations dans toutes les variables.

Visualiseur dynamique 2D

Cette procédure est conçue pour afficher graphiquement plusieurs séries temporelles de façon à aider les utilisateurs à visualiser les changements de ces variables dans le temps. A partir de n séries temporelles observées sur p périodes, le logiciel génère un affichage dynamique qui illustre comment chacune des variables évolue dans le temps. Des applications graphiques classiques sont : variables démographiques annuelles pour différents pays, ventes trimestrielles pour différentes divisions dans une entreprise, indices économiques mensuels pour différentes régions, cours de clôture journaliers pour différentes actions d’un portefeuille. Le graphique de base est un graphique en bulles affiché dans un repère X-Y. Les positions sur les axes X et Y représentent les valeurs de deux variables primaires de données. Les tailles et les couleurs des bulles peuvent être utilisées pour illustrer d’autres variables. Lorsque les périodes se modifient, l’analyste peut suivre les variations dans toutes les variables.

Visualiseur dynamique 3D

Cette procédure est conçue pour afficher graphiquement plusieurs séries temporelles de façon à aider les utilisateurs à visualiser les changements de ces variables dans le temps. A partir de n séries temporelles observées sur p périodes, le logiciel génère un affichage dynamique qui illustre comment chacune des variables évolue dans le temps. Des applications graphiques classiques sont : variables démographiques annuelles pour différents pays, ventes trimestrielles pour différentes divisions dans une entreprise, indices économiques mensuels pour différentes régions, cours de clôture journaliers pour différentes actions d’un portefeuille. Le graphique de base est un graphique en bulles affiché dans un repère X-Y-Z. Les positions sur les axes X, Y et Z représentent les valeurs de trois variables primaires de données. Les tailles et les couleurs des bulles peuvent être utilisées pour illustrer d’autres variables. Lorsque les périodes se modifient, l’analyste peut suivre les variations dans toutes les variables.

Diagramme en cascade ordonné

Le diagramme en cascade ordonné est fréquemment utilisé pour montrer comment une variable d’intérêt augmente ou diminue dans un échantillon d’individus. Les données sont triées et affichées dans un diagramme en bâtons ayant habituellement une ligne de base à 0. Une ligne de référence peut être ajoutée dans le diagramme pour afficher une valeur cible. Une application courante en oncologie est par exemple la visualisation des évolutions d’une tumeur en fonction d’un médicament.

Diagramme en cascade séquentiel

Le diagramme en cascade séquentiel est fréquemment utilisé pour illustrer l’effet cumulé de contributions positives et négatives dans la décroissance d’une valeur totale. Les bâtons représentent chacune des contributions ainsi que les totaux et sous-totaux. Parmi les usages possibles de ce diagramme : finance, inventaire, analyse de performance, recrutement, analyse démographique.

Diagramme en cascade 3D

Le diagramme en cascade 3D est fréquemment utilisé pour afficher plusieurs colonnes de données par rapport à une variable commune. Un exemple courant d’utilisation est le tracé de décroissance spectrale cumulative dans lequel un spectre est affiché à plusieurs instants pour visualiser les modifications de son amplitude en fonction de la fréquence et du temps. En général, ces graphiques sont utilisés pour montrer les modifications dans une variable quantitative en fonction du temps et d’un autre facteur.

Graphique treillis (Y numérique)

La Statlet Graphique treillis – Y numérique affiche les caractéristiques les caractéristiques d’une unique variable quantitative pour différentes combinaisons d’une ou de deux variables de conditionnement sous la forme de boîtes à moustaches, d’histogrammes d’effectifs ou de graphiques de normalité.

Graphique treillis (Y catégoriel)

La Statlet Graphique treillis – Y catégoriel affiche les caractéristiques d’une unique variable catégorielle pour différentes combinaisons d’une ou de deux variables de conditionnement sous la forme de diagrammes en bâtons, de diagrammes circulaires ou de diagrammes en anneaux.

Graphique treillis (Y vs X)

La Statlet Graphique treillis – Y vs X affiche les relations entre deux variables pour différentes combinaisons d’une ou de deux variables de conditionnement sous la forme de nuages de points ou de graphiques de régressions.

Graphique treillis (Z vs X and Y)

La Statlet Graphique treillis – Z vs X et Y affiche les relations entre trois variables pour différentes combinaisons d’une ou de deux variables de conditionnement sous la forme de diagrammes en bulles, de graphiques de régressions et de lissages LOWESS.