PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

Apprentissage de Relations « Généralisation / Spécialisation » entre Concepts – Application à la Structuration Hiérarchique Automatique de Corpus
Hermine Njike-Fotzo and Patrick Gallinari
In: COnférence en Recherche Information -CORIA 2004, 10-12 march 2004, Toulouse, France.

Abstract

Nous étudions comment apprendre automatiquement à partir de corpus, des hiérarchies de concepts obéissant à une relation du type généralisation / spécialisation. Nous proposons une méthode qui permet à partir de concepts identifiés automatiquement sur un corpus de documents, d’apprendre des relations généralisation / spécialisation à partir de cooccurrence de ces concepts, puis de construire une hiérarchie ordonnée suivant cette même relation. A titre d’application, nous montrons comment utiliser cette hiérarchie de concepts pour construire une hiérarchie de documents. Nous introduisons des critères originaux qui permettent d’évaluer la qualité des hiérarchies ainsi construite et de les comparer entre elles ou avec des hiérarchies manuelles. Nous décrivons une série de tests réalisés sur des corpus de documents provenant de portails internet, ces corpus sont extraits des hiérarchies LookSmart et NewScientist.

EPrint Type:Conference or Workshop Item (Paper)
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Information Retrieval & Textual Information Access
ID Code:564
Deposited By:Hermine Njike-Fotzo
Deposited On:26 December 2004