Soutenance de thèse de Marius BARTCUS - Laboratoire LSIS

Le Bureau des Études Doctorales a le plaisir de vous informer que

Monsieur Marius BARTCUS,

Doctorant au laboratoire LSIS - Laboratoire des Sciences de l’Information et des Systèmes – UMR CNRS 7296, rattaché à l’école doctorale 548 « Mer et Sciences », sous la direction de M. Hervé GLOTIN, co-encadré par M. Faicel CHAMROUKHI, soutiendra publiquement sa thèse en vue de l’obtention du doctorat en informatique, sur le thème suivant :

« Modèles de mélanges Bayésiens non-paramétriques parcimonieux pour la classification automatique »

Le lundi 26 octobre 2015 à 13h00, à l’Université de Toulon, Campus de la Garde, bâtiment K, amphi. K018,

devant un jury composé de :

M. Younès BENNANI, Professeur, Université Paris 13, Rapporteur,
M. Christophe BIERNACKI, Professeur, Université Lille 1, INRIA, Rapporteur,
M. Allou SAMÉ, Chargé de recherche HDR, IFSTTAR, Examinateur,
M. Badih GHATTAS, Maître de Conférences HDR, Aix Marseille Université, Examinateur,
M. Hervé GLOTIN, Professeur, Université de Toulon, Directeur,
M. Faicel CHAMROUKHI, Maître de Conférences, Université de Toulon, Encadrant,

Résumé :

Cette thèse porte sur l’apprentissage statistique et l’analyse de données multi-dimensionnelles. Elle se focalise particulièrement sur l’apprentissage non supervisé de modèles génératifs pour la classification automatique. Nous étudions les modèles de mélanges Gaussians, aussi bien dans le contexte d’estimation par maximum de vraisemblance via l’algorithme EM, que dans le contexte Baéyesien d’estimation par Maximum A Posteriori via des techniques d’échantillonnage par Monte Carlo. Nous considérons principalement les modèles de mélange parcimonieux qui reposent sur une décomposition spectrale de la matrice de covariance et qui offre un cadre flexible notamment pour les problèmes de classification en grande dimension. Ensuite, nous investiguons les mélanges Bayésiens non-paramétriques qui se basent sur des processus généraux flexibles comme le processus de Dirichlet et le Processus du Restaurant Chinois. Cette formulation non-paramétrique des modèles est pertinente aussi bien pour l’apprentissage du modèle, que pour la question difficile du choix de modèle. Nous proposons de nouveaux modèles de mélanges Bayésiens non-paramétriques parcimonieux et dérivons une technique d’échantillonnage par Monte Carlo dans laquelle le modèle de mélange et son nombre de composantes sont appris simultanément à partir des données. La sélection de la structure du modèle est effectuée en utilisant le facteur de Bayes. Ces modèles, par leur formulation non-paramétrique et parcimonieuse, sont utiles pour les problèmes d’analyse de masses de données lorsque le nombre de classe est indéterminé et augmente avec les données, et lorsque la dimension est grande. Les modèles proposés validés sur des données simulées et des jeux de données réelles standard. Ensuite, ils sont appliqués sur un problème réel difficile de structuration automatique de données bioacoustiques complexes issues de signaux de chant de baleine. Enfin, nous ouvrons des perspectives Markoviennes via les processus de Dirichlet hiérarchiques pour les modèles Markov cachés.

Université de Toulon - https://www.univ-tln.fr/Soutenance-de-these-de-Marius-BARTCUS-Laboratoire-LSIS.html - comweb@univ-tln.fr