logo inria

RR-4566 - Mixture of linear mixed models Application to repeated data clustering

-----------------------
Celeux, Gilles - Lavergne, Christian - Martin, Olivier
Rapport de recherche de l'INRIA - Rhone-Alpes , Equipe : IS2
20 pages - Septembre 2002 - Document en anglais
Titre français : Mélange de modèles linéaires mixtes Application à la classification de données répétées
-----------------------
Abstract : The problem of finite mixture analysis from repeated data is considered. Data variability is taken into account through linear mixed models leading to a mixture of mixed models. The maximum likelihood estimation of this family of models through the EM algorithm is presented. The problem of selecting a particular mixture of mixed models is considered. Illustrative Monte Carlo experiments are presented and an application to the clustering of gene expression profiles is detailed. All those experiments highlight the interest of linear mixed model mixtur es for taking account of data variability in a proper way.

Résumé : Nous proposons un modèle de mélange pour des données répétées. Ce modèle prend en compte la variabilité des données par des modèles linéaires mixtes associés à chaque composant du mélange. Nous présentons l'estimation des paramètres de ce modèle par la méthode du maximum de vraisemblance via l'algorithme EM. Nous étudions aussi leproblème de sélection d'un modèle particulier. Des expérimentations de Monte-Carlo et une application à un problème de classification de profils d'expression de gènes sont présentées- . Elles illustrent la capacité de notre modèle à prendre en compte efficacement la variabilité des données.
-----------------------
Key-Words : RANDOM EFFECT / LINEAR MODEL / MIXTURE MODEL / CLUSTER ANALYSIS / GENE EXPRESSION PROFILE / MICROARRAY DATA
Mots-clés : EFFETS ALÉATOIRES / MODÈLE LINÉAIRE / MODÈLE DE MÉLANGE / CLASSIFICATION / PROFILS D'EXPRESSION DE GÈNES / PUCES À ADN
-----------------------