logo inria

RT-0302 - Model-based Cluster and Discriminant Analysis with the MIXMOD software

-----------------------
Biernacki, Christophe - Celeux, Gilles - Govaert, Gérard - Langrognet, Florent
Rapport technique de l'INRIA - Futurs , Equipe : SELECT
20 pages - Janvier 2005 - Document en anglais
- Les pages 16, 17, 18, 19 sont en couleur
Titre français : MIXMOD: un logiciel pour la classification et l'analyse discriminante fondé sur le modèle de mélange
-----------------------
Abstract :

The mixmod (mixture modelling) software fits mixture models to a given data set with a density estimation, a clustering or a discriminant analysis purpose. A large variety of algorithms to estimate the mixture parameters are proposed (EM, Classification EM, Stochastic EM) and it is possible to combine them to lead to different strategies in order to get a sensible maximum of the likelihood (or complete-data likelihood) function. mixmod is currently focused on multivariate Gaussian mixtures and fourteen different Gaussian models can be considered according to different assumptions on the component variance matrix eigenvalue decomposition. Moreover, different information criteria for choosing a parsimonious model (the number of mixture components, for instance), some of them favoring either a cluster analysis or a discriminant analysis view point, are included. Written in C++, mixmod is interfaced with Scilab and Matlab. The software, the statistical documentation and also the user guide are available on the internet at the following address:

http://www-math.univ-fco mte.fr/mixmod/index.php.


Résumé :

Le logiciel mixmod est un logiciel d'analyse de mélange de lois gaussiennes. Il a été conçu pour être utilisé dans un contexte d'estimation de densités, de classification ou d'analyse discriminante. Il propose une grande variété d'algorithmes (EM et ses versions stochastique ou de classification) pour estimer les paramètres d'un mélange. Il utilise une paramétrisation des matrices variances fondée sur leur décomposition spectrale et propose ainsi quatorze modèles différents. De plus, plusieurs critères de choix d'un modèle parcimonieux sont proposés, certains d'entre eux privilégiant un objectif de classification. mixmod est écrit en C++ et possède des interfaces avec Scilab et Matlab. Le logiciel, sa documentation statistique et son guide d'utilisation sont disponibles à l'adresse suivante :

http://www-math.univ-fcomte.fr/ mixmod/index.php.

-----------------------
Key-Words : GAUSSIAN MIXTURE MODELS / VARIANCE MATRIX EIGENVALUE DECOMPOSITION / MAXIMUM LIKELIHOOD / EM ALGORITHM / CLASSIFICATION EM / STOCHASTIC EM / INTEGRATED LIKELIHOOD / INTEGRATED COMPLETED LIKELIHOOD / CLASSIFICATION ENTROPY / CROSS VALIDATED ERROR RATE
Mots-clés : MODÈLES DE MÉLANGE GAUSSIEN / DÉCOMPOSITION SPECTRALE DE MATRICES VARIANCES / MAXIMUM DE VRAISEMBLANCE / ALGORITHME EM / EM STOCHASTIQUE / EM CLASSIFIANT / VRAISEMBLANCE INTÉGRÉE / VRAISEMBLANCE INTÉGRÉE COMPLÉTÉE / ENTROPIE DE CLASSIFICATION / VALIDATION CROISÉE / CRITÈRES AIC ET BIC
-----------------------