PASCAL - Pattern Analysis, Statistical Modelling and Computational Learning

Controle du risque multiple en selection de regles d'association
E. Prudhomme, S. Lallich and Olivier Teytaud
Revue Nouvelles Technologies de l'Information - E2 Volume Vol. 2, Conference Extraction et Gestion des Connaissances, pp. 305-316, 2004.

Abstract

Les algorithmes d'extraction de regles d'association donnent une multitude de regles pas toujours exploitables. Nous suggerons d'epurer de telles bases en eliminant les regles non statistiquement significatives. La multitude de tests pratiques conduit a multiplier les regles selectionnees a tort. Apres avoir presente des procedures issues de la biostatistique qui controle non pas le risque mais le nombre de fausses decouvertes, nous proposons BSFD, un algorithme original fonde sur le bootstrap qui selectionne les regles significatives en controlant le nombre de fausses decouvertes. Des experimentations montrent l'efficacite de ces procedures.

Postscript - Requires a viewer, such as GhostView
EPrint Type:Article
Project Keyword:Project Keyword UNSPECIFIED
Subjects:Learning/Statistics & Optimisation
Information Retrieval & Textual Information Access
ID Code:637
Deposited By:Olivier Teytaud
Deposited On:29 December 2004