Machine learning

Objectif

Approfondir les principaux algorithmes d’apprentissage statistique. Appliquer sur des données d’entreprises les différents algorithmes et les comparer. Apprendre à mettre en œuvre ces algorithmes sur des données réelles, à analyser leurs résultats, et comparer leurs performances.

Descriptif

  • Rappels sur les méthodes de base de l’apprentissage supervisé et non supervisé
  • Les Support Vector Machines (SVM)
  • Les Méthodes d’agrégation : bagging, forêt aléatoires, boosting

Pré-requis

De bonnes bases en régression linéaire et en analyse discriminante par arbres de décision. De bonnes notions de programmation avec R et Python.

Références bibliographiques

  • R.A. Berk, Statistical learning from a regression perspective, volume 14. Springer, 2008
  • N. Cristianini and J. Shawe-Taylor, An introduction to support vector machines. Cambridge University Press, Cambridge, UK, 2000.
  • T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, Second Edition, 2017. https://hastie.su.domains/ElemStatLearn/
  • O’ Reilly, J. Vanderplas (Auteur) G. Picarde (Traduction), Python pour la Data Science - Les meilleures outils pour travailler avec les données. First Interactive, 2022.
  • S. Tuffery, Modélisation prédictive et Apprentissage statistique avec R, Éditions Technip, 2e édition, 2017
  • S. Tuffery, Data mining et statistique décisionnelle, Éditions Technip, 5e édition, 2017