PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

Classification automatique de données ordinales et modèle de mélange
Cyril Goujet and Gérard Govaert
In: SFdS'2005, XXXVz journées de Statistiques, 24-28 May 2005, Pau, France.

Abstract

Cet article propose une méthode de classification de données ordinales, basée sur l'algorithme EM et sur le modèle proposé par Everitt (1988) dans lequel on considère que les données sont issues d'une loi multinormale discrétisée dont les frontières des intervalles sont inconnues. Cette approche offre trois principaux avantages. Tout d'abord, contrairement à un modèle basé sur la loi multinomiale, elle permet de prendre en compte toute l'information des données. Ensuite, elle s'adapte parfaitement aux données des enquêtes de satisfaction, et notamment celles menées par l'informatique de Renault. Enfin, elle permet de réaliser des comparaisons entre différentes enquêtes de satisfaction présentant les mêmes questions mais ne proposant pas les mêmes modalités de réponses. Références B. S. Everitt (1988), A finite mixture model for the clustering of mixed-mode data, Statistics & Probability Letters, 6 :305-309.

EPrint Type:Conference or Workshop Item (Talk)
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Computational, Information-Theoretic Learning with Statistics
ID Code:1948
Deposited By:Gérard Govaert
Deposited On:30 December 2005