Intégration de connaissances expertes dans le processus de fouille de données pour l'extraction d'informations pertinentes

Abstract

L’extraction automatique de connaissances à partir des données peut être considérée comme la découverte d’informations enfouies dans de très grands volumes de données. Les approches Actuelles, pour évaluer la pertinence des informations extraites, se distinguent en deux catégories : les approches objectives qui mettent en oeuvre des mesures d’intérêt afin d’évaluer les propriétés statistiques des modèles extraits et les approches subjectives qui confrontent les modèles extraits à des connaissances exprimées sur le domaine et nécessitent généralement l’interrogation d’experts. Toutefois, le choix de modèles pertinents en regard de la connaissance métier d’un expert reste un problème ouvert et l’absence de formalisme dans l’expression des connaissances nuit à la mise au point de techniques automatiques de confrontation des modèles permettant d’exploiter toute la richesse sémantique des connaissances expertes. L’approche KEOPS que nous proposons dans ce mémoire, répond à cette problématique en proposant une méthodologie qui intègre les connaissances des experts d’un domaine tout au long du processus de fouille. Un système d’information dirigé par une ontologie (ODIS) joue un rôle central dans le système KEOPS en permettant d’organiser rationnellement non seulement la préparation des données mais aussi la sélection et l’interprétation des modèles générés. Une mesure d’intérêt est proposée afin de prendre en compte les centres d’intérêt et le niveau de connaissance des experts. Le choix des modèles les plus pertinents se base sur une évaluation à la fois objective pour évaluer la précision des motifs et subjective pour évaluer l’intérêt des modèles pour les experts du domaine. Enfin l’approche KEOPS facilite la définition de stratégies pour améliorer le processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l’approche KEOPS favorisent l’automatisation du processus de fouille de données, et ainsi, une dynamique d’apprentissage peut être initiée pour obtenir un processus de fouille particulièrement bien adapté au domaine étudié. KEOPS a été mise en oeuvre dans le cadre de l’étude de la gestion des relations avec les allocataires au sein des Caisses d’Allocations Familiales. L’objectif de cette étude a été d’analyser la relation de service rendu aux allocataires afin de fournir aux décideurs des connaissances précises, pertinentes et utiles pour l’amélioration de ce service.

Publication
Thèse de doctorat, Université Nice Sophia Antipolis