Les données qualitatives catégorielles sont des données qui classent des observations dans une ou plusieurs catégories. Par exemple, un produit peut être jugé bon ou mauvais ou une réponse à une enquête peut inclure des catégories comme en accord, en désaccord ou sans opinion. Statgraphics Centurion contient de nombreuses procédures pour ce type de données dont pour la modélisation l’analyse de variance, la régression ou la maîtrise statistique de procédés.
Analyse de données qualitatives
Tri à plat
Cette procédure est conçue pour résumer une unique colonne de données qualitatives. Elle calcule les nombres de fois où chacune des valeurs uniques de cette colonne apparaît. Les effectifs sont affichés sous la forme de tableaux et de graphiques : diagramme en bâtons, diagramme circulaire et diagramme en anneau.
Diagrammes circulaire et en anneau
Cette procédure affiche une colonne de comptages ou de fréquences sous la forme d’un diagramme circulaire ou en anneau. Si désiré, une part peut être écartée dans le diagramme circulaire.
Tableau des effectifs
Cette procédure analyse une unique colonne de comptages. Elle affiche les comptages sous la forme d’un diagramme en bâtons et d’un diagramme circulaire. Des tests statistiques sont également mis en oeuvre pour déterminer si les données sont conformes à un à jeu de probabilités multinomiales.
Tableau croisé
Cette procédure est conçue pour résumer deux colonnes de données qualitatives. Elle construit un tableau à deux entrées affichant les comptages des occurrences de toutes les paires de valeurs uniques dans les deux colonnes. Des statistiques sont calculées pour quantifier le degré d’association entre les colonnes et des tests sont effectués pour déterminer s’il y a ou non une dépendance statistiquement significative entre la valeur dans une colonne et la valeur dans la seconde colonne. Les comptages sont affichés à la fois sous forme de tableaux et de graphiques : diagramme en bâtons, en mosaïque et en barres 3D.
Tableau de contingence
Cette procédure est conçue pour analyser et afficher les effectifs d’un tableau à deux entrées. De telles données sont fréquemment collectées comme résultats d’un questionnaire. Des statistiques sont calculées pour quantifier le degré d’association entre les colonnes et des tests sont effectués pour déterminer s’il y a ou non une dépendance statistiquement significative entre la valeur dans une colonne et la valeur dans la seconde colonne. Les comptages sont affichés à la fois sous forme de tableaux et de graphiques : diagramme en bâtons, en mosaïque et en barres 3D.
Lissage par la médiane
Cette procédure a pour but d’identifier les formes dans un tableau de données à deux entrées. Elle le fait en exprimant chaque cellule du tableau comme la somme d’une valeur commune, d’un effet ligne, d’un effet colonne et d’un résidu. Cette procédure est similaire à une analyse de la variance à deux facteurs sauf qu’elle base les estimations des effets sur les médianes plutôt que sur les moyennes.
Analyse des correspondances
Cette procédure crée une carte des lignes et des colonnes d’un tableau de contingence à deux entrées dans le but de fournir des informations sur les relations entre les modalités des variables définissant ces lignes et ces colonnes. Souvent, pas plus de deux ou trois dimensions sont nécessaires pour afficher la plus grande partie de la variabilité ou « inertie » du tableau. Un élément important des sorties est le plan factoriel dans lequel les distances entre modalités sont des mesures des similarités.
Analyse des correspondances multiples
Cette procédure crée une carte des lignes et des colonnes d’un tableau de contingence à deux entrées dans le but de fournir des informations sur les relations entre les modalités des variables définissant ces lignes et ces
colonnes. Souvent, pas plus de deux ou trois dimensions sont nécessaires pour afficher la plus grande partie de la variabilité ou « inertie » du tableau. Un élément important des sorties est le plan factoriel dans lequel les distances entre modalités sont des mesures des similarités.
Graphique de Likert
Cette procédure analyse des données enregistrées sur une échelle de jugement de Likert. Les échelles de Likert sont couramment utilisées dans des enquêtes pour enregistrer les réponses de personnes à des énoncés.
Analyse de la fiabilité des items
Cette procédure est conçue pour mesurer la cohérence interne ou la fiabilité d’un ensemble de variables. Elle est couramment utilisée pour établir à partir d’un ensemble de questions dans une enquête, chaque question étant posée pour obtenir des informations sur une même caractéristique, la cohérence des résultats concernant cette caractéristique. L’information principale donnée par cette procédure est l’alpha de Cronbach.
Graphique tornade / papillon
La procédure Graphiques tornade/papillon crée deux graphiques similaires pour comparer deux échantillons de données de type attribut. Chaque graphique est constitué de deux ensembles de bâtons qui permettent de visualiser les distributions de chaque échantillon dans diverses catégories. La seule différence entre les graphiques est la localisation des libellés.
Diagramme de Venn et Euler
Cette procédure crée des diagrammes affichant des fréquences d’occurrences d’événements. Elle affiche des régions circulaires qui représentent les fréquences d’événements spécifiques dans lesquelles les chevauchements des cercles indiquent des occurrences simultanées de plus d’un événement.