Machine learning
Objectif
Approfondir les principaux algorithmes d’apprentissage statistique. Appliquer sur des données d’entreprises les différents algorithmes et les comparer. Apprendre à mettre en œuvre ces algorithmes sur des données réelles, à analyser leurs résultats, et comparer leurs performances.
Descriptif
- Rappels sur les méthodes de base de l’apprentissage supervisé et non supervisé
- Les Support Vector Machines (SVM)
- Les Méthodes d’agrégation : bagging, forêt aléatoires, boosting
Pré-requis
De bonnes bases en régression linéaire et en analyse discriminante par arbres de décision. De bonnes notions de programmation avec R et Python.
Références bibliographiques
- R.A. Berk, Statistical learning from a regression perspective, volume 14. Springer, 2008
- N. Cristianini and J. Shawe-Taylor, An introduction to support vector machines. Cambridge University Press, Cambridge, UK, 2000.
- T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, Second Edition, 2017. https://hastie.su.domains/ElemStatLearn/
- O’ Reilly, J. Vanderplas (Auteur) G. Picarde (Traduction), Python pour la Data Science - Les meilleures outils pour travailler avec les données. First Interactive, 2022.
- S. Tuffery, Modélisation prédictive et Apprentissage statistique avec R, Éditions Technip, 2e édition, 2017
- S. Tuffery, Data mining et statistique décisionnelle, Éditions Technip, 5e édition, 2017