PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

SVM et apprentissage des très grandes bases de données
Gaëlle Loosli, Stéphane Canu and Leon Bottou
In: Conférence sur l'apprentissage, 22-24 May 2006, Tregastel, France.

Abstract

Le but de ce travail est de montrer qu'il est possible de faire de la discrimination à l'aide de Séparateurs à Vaste Marge (SVM) sur des très grandes bases de données (des millions d'exemples, des centaines de caractéristiques et une dizaine de classes). Pout traiter cette masse de données, nous nous proposons d'utiliser un algorithme en ligne où les exemples sont présentés les uns après les autres. Cette approche permet à la fois une mise à jour rapide de la solution (qui ne dépend que d'un seul exemple à la fois) et la gestion efficace de la base d'apprentissage (qui n'a pas à être entièiement en mémoire). L'application visée est la reconnaissance de caractères avec prise en compte des invariances dans les données. Pour cela, nous adaptons l'algorithme LASVM (une méthode en ligne pour les SVM) en nous inspirant de [loo_05] pour y intégrer la connaissance a priori sur l'invariance.

PDF - Requires Adobe Acrobat Reader or other PDF viewer.
EPrint Type:Conference or Workshop Item (Paper)
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Learning/Statistics & Optimisation
Theory & Algorithms
ID Code:2951
Deposited By:Gaëlle Loosli
Deposited On:19 December 2006