Modèles linéaires en grande dimension

Descriptif

Ce cours présente quelques stratégies permettant de répondre au problème de la grande dimension en apprentissage supervisé et non supervisé. Il est illustré avec le logiciel R.

  • Le fléau de la dimension : propriétés théoriques des estimateurs paramétriques et non paramétriques en grande dimension
  • Réduction de la dimension : régression sur composantes principales (PCR) et régressions Partial Least Square (PLS)
  • Régularisation : approches Ridge, Lasso, Elastic Net
  • Variantes du k-means : divergences de Bregman, trimmed k-means
  • Méthodes à noyaux : kernel k-means, clustering spectral

Bibiographie

  • Cornillon, P.A., Hengartner, N., Matzner-Lober, E. et Rouvière, L. (2019). Régression avec R, EDP Sciences.
  • Giraud, C. (2015). Introduction to High-Dimensional Statistics, CRC Press.
  • Page web du cours pour la partie apprentissage supervisé : https://lrouviere.github.io/stat_grand_dim