v2.11.0 (5932)

Enseignement de Master - APM_5DS23_TP : Stochastic approximation and applications to reinforcement learning

Descriptif

Cours à Télécom Paris, le Jeudi matin au second semestre
http://datascience-x-master-paris-saclay.fr/le-master/structure-des-enseignements/

Objectifs pédagogiques

Acquis d'apprentissage
À l'issue de l'UE, l'élève sera capable de:
- Analyser la convergence d’algorithmes numériques dans un environnement bruité
- Mettre en oeuvre des méthodes d’apprentissage par renforcement

Compétences de rattachement (et justification)
- BC10.3 – Analyser une résolution par des approches formelles ou mathématiques; Justification : L’UE fournit les outils permettant d’analyser la convergence des algorithmes itératifs rencontrés notamment dans le domaine de la science des données.
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : L’UE permet aux élèves de comprendre la mise en oeuvre d’algorithmes d’apprentissage par renforcement, permettant de déterminer les politiques optimales de décision dans un environnement stochastique.

8 heures de travail personnel estimé pour l’étudiant.

effectifs minimal / maximal:

10/

Diplôme(s) concerné(s)

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Auditeurs libres des cycles ingénieurs IP Paris

Pour les étudiants du diplôme Echange international non diplomant

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

Contrôle sur table avec documents autorisés

Pour les étudiants du diplôme M2 DS - Data Science

Vos modalités d'acquisition :

Contrôle sur table avec documents autorisés

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 3 ECTS

Le coefficient de l'UE est : 3

La note obtenue rentre dans le calcul de votre GPA.

Programme détaillé

 

Méthodes pédagogiques

L’UE est fondée sur un déroulement de type théorème/preuve en cours, avec une part significative du temps consacrée aux exercices.
Veuillez patienter