v2.6.4 (3795)

Enseignement de Formation Continue - FE9BD04 : Data science : introduction au machine-learning

Descriptif

Les sciences de l’information transforment aujourd’hui de nombreux domaines tels que la médecine, la finance, le marketing, la défense ou encore la sécurité. La capacité à traiter et analyser des données de très grande dimension, souvent massives (Big Data) est un enjeu majeur dans ces secteurs d’activités. La discipline qui développe et étudie des méthodes concrètes pour modéliser ce type de données est le Machine Learning. A l’interface des mathématiques appliquées et de l’informatique, cette discipline vise à produire des outils de prédiction et d'aide à la décision, automatiquement, à partir d’un apprentissage sur des données et des évènements. L'apparition d'algorithmes très performants pour la classification de données en grande dimension, tels que le Boosting ou les Support Vector Machines (SVM) dans le milieu des années 90, a progressivement transformé le champ occupé jusqu'alors par la statistique traditionnelle. Celle-ci s'appuyait en grande partie sur le prétraitement réalisé par l'opérateur humain.

Objectifs pédagogiques

  • Identifier les fondements historiques et théoriques de l’apprentissage automatique.
  • Utiliser les algorithmes majeurs en Machine Learning et reconnaître les situations dans lesquelles les appliquer.

Diplôme(s) concerné(s)

Pour les étudiants du diplôme Formations Courtes

Programme détaillé

Problématiques traitées par le Machine Learning 

  • Classification
  • Régression
  • Réduction de dimension

Introduction à la théorie de l’apprentissage (principe de la minimisation de risque empirique) – Exemples applicatifs :

  • LDA (Linear Discriminant Analysis) – supervisé
  • K-means – non supervisé

Sur-apprentissage, sélection de modèle

Optimisation pour le Machine Learning

Régression logistique

Arbres de classification

Méthodes ensemblistes

SVM (Support Vector Machine)

Introduction aux réseaux de neurones

Synthèse et conclusion

Veuillez patienter