PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

Apprentissage semi supervisé via un SVM parcimonieux : calcul du chemin de régularisation
Gilles Gasso, Karina Zapien and Stéphane Canu
Information Interaction Intelligence Volume 2, Number 8, pp. 41-67, 2008. ISSN 1630-649X

Abstract

L’apprentissage semi-supervisé vise à résoudre des problèmes de reconnaissance des formes comportant un petit nombre de données étiquetées pour un grand nombre de points sans étiquettes. Ces derniers points servant à dévoiler la structure sous-jacente des données, il est pertinent d’utiliser des graphes de similarité pour représenter cette structure. Les méthodes à noyaux telles que l’algorithme du Laplacien SVM [3] offrent un cadre flexible permettant d’intégrer cette information de structure comme une contrainte dans un problème SVM sur les points étiquetés. Malheureusement, la fonction de décision obtenue s’exprime en fonction de tous les points (avec ou sans étiquettes) et est donc peu parcimonieuse. Nous proposons ici une solution consistant à ajouter une pénalisation supplémentaire de type L1 qui introduit la parcimonie dans les variables explicatives. En se fondant sur les travaux de Wang [24], nous présentons ici un chemin de régularisation permettant de calculer efficacement la solution. L’application sur des données simulées et réelles montre les avantages d’un modèle parcimonieux où nous obtenons les mêmes niveaux de performance que le Laplacien SVM en réduisant significativement la taille de l’ensemble des variables explicatives.

PDF - PASCAL Members only - Requires Adobe Acrobat Reader or other PDF viewer.
EPrint Type:Article
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Learning/Statistics & Optimisation
ID Code:6125
Deposited By:Gilles Gasso
Deposited On:08 March 2010