Modèle logistique et analyse discriminante

Descriptif

Le cours présente tout d’abord le modèle linéaire généralisé, puis se concentre en détails sur le modèle de régression logistique qui en est une déclinaison. Les aspects scoring et grande dimension sont également abordés. Le cours est illustré à l’aide du logiciel R par de nombreux jeux de données réelles,

Déroulement du cours

  • Introduction au modèle linèaire généralisé : définition générale, exemples du modèle linéaire gaussien, du modèle de régression logistique et du modèle de régression de Poisson.
  • Modèle de régression logistique : identifiabilité, interaction entre variables explicatives, odds ratio, estimateur du maximum de vraisemblance, algorithme IRLS, tests de significativité des paramètres (Wald, rapport de vraisemblance, score).
  • Choix de modèles de régression logistiques : tests entre modèles emboîtés, critères AIC et BIC, erreur de classification, notions de modèle saturé et de déviance, tests d’adéquation de Pearson et d’Hosmer-Lemeshow, analyse des résidus.
  • Analyse discriminante : modèles LDA et QDA, approche géométrique.