Apprentissage non supervisé
Descriptif
Ce cours a pour objectif d’aborder les principales méthodes de classification (non-supervisée). En premier lieu, nous aborderons les notions de ressemblance entre individus, puis, nous étudierons les méthodes de classification hiérarchique ainsi que les critères d’agrégation et d’optimalité. Ensuite, nous présenterons les algorithmes de réallocation dynamique permettant de partitionner les individus autour de centres mobiles ainsi que leurs propriétés. Dans un dernier temps, nous aborderons une approche probabiliste de la classification à travers l’utilisation de modèles de mélange et de l’algorithme EM (Expectation-Maximization). Ces différentes notions seront illustrées tout au long du cours et lors de séances de TP à l’aide du logiciel R.
Plan du cours
- Objectifs généraux
- Notion de similarité
- Méthodes de classification hiérarchique
- Classification autour de centres mobiles
- Modèles de mélange et algorithme EM
Bibliographie
- Lebarbier E. and Mary-Huard T. Classification non-supervisée. Notes de cours, AgroParisTech.
- Gordon A.D. (1999). Classification. Chapman \& Hall/CRC, Boca Raton, 2 ed.
- Kaufman L. and Rousseeuw P. (1990). Finding Groups in Data : An Introduction to Cluster Analysis. Wiley, New-York.
- Everitt B. (1995). Cluster analysis. Arnold, London
- McLachlan G. and Krishnan T. (2008). The EM algorithm and extensions. Wiley Series in Probability and Statistics, Wiley Interscience.