Thèse

Titre :

Apprentissage de modèles génératifs pour le diagnostic de systèmes complexes avec labellisation douce et contraintes spatiales

Mots-clefs :

Apprentissage statistique, Labellisation douce, Modèles génératifs, Fonctions de croyance, Algorithme EM, Analyse en facteurs indépendants, Diagnostic

Thèse soutenue le 16 Janvier 2009 devant le jury composé de :

  • Gerard Govaert, Professeur de l’Université de Technologie de Compiègne (Président)
  • Christophe Ambroise, Professeur de l’Université d’Evry (Rapporteur)
  • Michel Verleyssen, Professeur de l’Université Catholique de Louvain (Rapporteur)
  • Patrice Aknin, Directeur de Recherche de l’Institut National de Recherche sur les Trnasports et leurs Sécurité (Directeur)
  • Thierry Denoeux, Professeur de l’Université de Technologie de Compiègne (Directeur)
  • Latifa Oukhellou, Maitre de Conférence de l’Université Paris 12 (Encadrante)

Téléchargements :

These (pdf)

Présentation (pdf)

Résumé :

Le thème principal de cette thèse concerne la formalisation et la résolution du problème de l’apprentissage statistique lorsque les informations disponibles sur une ou plusieurs variables d’intérêt discrètes sont imprécises, incertaines. La solution proposée s’appuie sur une approche générative et sur l’utilisation de la théorie des fonctions de croyance afin de représenter l’information disponible sur ces variables. Nous montrons tout d’abord, comment des labels <<~doux~>>, prenant la forme de fonctions de masse de croyance, peuvent être utilisés pour estimer les paramètres d’un modèle de mélange grâce à un critère étendant les critères rencontrés dans le cadre probabiliste. Le problème d’optimisation associé est quant à lui résolu grâce à une extension de l’algorithme EM. Une démarche similaire, dans le cadre de l’analyse en facteurs indépendants, modèle génératif extrêmement parcimonieux faisant intervenir un ensemble de variables d’intérêts discrètes, est également présentée et étudiée. D’autres part, une solution pour tirer parti d’informations sur le processus de génération des données dans le cadre de ce modèle est proposée. Enfin, des résultats concernant un problème réel de diagnostic permettent de juger de l’intérêt de ces propositions. Ce problème de diagnostic concerne un élément essentiel de la chaîne de contrôle-commande des trains sur le réseau français : le circuit de voie.

Laisser un commentaire