PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

Apprentissage de fonctions d'ordonnancement semi--supervisé inductives
Vinh Truong, Massih Amini and Patrick Gallinari
In: Conference D'Apprentissage (CAp 2008), 29-31 May 2008, Ile de Porquerolles, France.

Abstract

Nous proposons dans ce papier une méthode inductive d'apprentissage de fonctions d'ordonnancement avec des données partiellement étiquetées. Les problèmes d'ordonnancement considérés ici sont des problèmes \textit{bipartites} où il existe une information désirée fixe pour laquelle on cherche à ordonner les instances pertinentes par rapport à cette information, au-dessus des instances non-pertinentes. Pour résoudre ce genre de problème les techniques existantes sont basées sur des méthodes transductives. Elles commencent généralement avec un graphe de similarité entre l'ensemble des données d'une base et cherchent ensuite à propager les scores des données étiquetées pertinentes sur le graphe. Notre approche est basée sur l'hypothèse des clusters (\emph{cluster assumption}) proposée en classification semi-supervisée. Elle commence à partitionner l'ensemble des exemples d'une base d'apprentissage et elle apprend ensuite une fonction de score régularisée qui pénalise les fortes variations entre deux exemples appartenant à une même partition. Pour apprendre cette fonction de score, nous utilisons la fonction \epsilon$\emph{-insensitive hinge}, qui permet de formaliser le problème d'optimisation comme une forme duale des Séparateurs à Vaste Marge (SVM). Une fois la fonction de score apprise, les exemples d'un nouvel ensemble pourront être ordonnés en fonction de la sortie de cette fonction. Les expériences menées sur des collections de l'état de l'art montrent que les données non--étiquetées permettent d'améliorer les performances en ordonnancement par rapport à une fonction de base apprise qu'avec des exemples étiquetés.

PDF - Requires Adobe Acrobat Reader or other PDF viewer.
EPrint Type:Conference or Workshop Item (Paper)
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Learning/Statistics & Optimisation
Theory & Algorithms
ID Code:4130
Deposited By:Massih Amini
Deposited On:17 May 2008