Apprentissage non supervisé

Descriptif

Ce cours a pour objectif d’aborder les principales méthodes de classification (non-supervisée). En premier lieu, nous aborderons les notions de ressemblance entre individus, puis, nous étudierons les méthodes de classification hiérarchique ainsi que les critères d’agrégation et d’optimalité. Ensuite, nous présenterons les algorithmes de réallocation dynamique permettant de partitionner les individus autour de centres mobiles ainsi que leurs propriétés. Dans un dernier temps, nous aborderons une approche probabiliste de la classification à travers l’utilisation de modèles de mélange et de l’algorithme EM (Expectation-Maximization). Ces différentes notions seront illustrées tout au long du cours et lors de séances de TP à l’aide du logiciel R.

Plan du cours

Objectifs généraux
Notion de similarité
Méthodes de classification hiérarchique
Classification autour de centres mobiles
Modèles de mélange et algorithme EM

Bibliographie

Lebarbier E. and Mary-Huard T. Classification non-supervisée. Notes de cours, AgroParisTech.
Gordon A.D. (1999). Classification. Chapman \& Hall/CRC, Boca Raton, 2 ed.
Kaufman L. and Rousseeuw P. (1990). Finding Groups in Data : An Introduction to Cluster Analysis. Wiley, New-York.
Everitt B. (1995). Cluster analysis. Arnold, London
McLachlan G. and Krishnan T. (2008). The EM algorithm and extensions. Wiley Series in Probability and Statistics, Wiley Interscience.