v2.11.0 (6242)

Enseignement de Master - APM_5DS23_TP : Stochastic approximation and applications to reinforcement learning

Descriptif

Cours à Télécom Paris, le Jeudi matin au second semestre
http://datascience-x-master-paris-saclay.fr/le-master/structure-des-enseignements/

Objectifs pédagogiques

Acquis d'apprentissage
À l'issue de l'UE, l'élève sera capable de:
- Analyser la convergence d’algorithmes numériques dans un environnement bruité
- Mettre en oeuvre des méthodes d’apprentissage par renforcement

Compétences de rattachement (et justification)
- BC10.3 – Analyser une résolution par des approches formelles ou mathématiques; Justification : L’UE fournit les outils permettant d’analyser la convergence des algorithmes itératifs rencontrés notamment dans le domaine de la science des données.
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : L’UE permet aux élèves de comprendre la mise en oeuvre d’algorithmes d’apprentissage par renforcement, permettant de déterminer les politiques optimales de décision dans un environnement stochastique.

8 heures de travail personnel estimé pour l’étudiant.

effectifs minimal / maximal:

10/

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Echange international non diplomant

Pour les étudiants du diplôme Diplôme d'ingénieur

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS
  • Crédit d'Option 3A acquis : 2.5

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Auditeurs libres des cycles ingénieurs IP Paris

Programme détaillé

 

Méthodes pédagogiques

L’UE est fondée sur un déroulement de type théorème/preuve en cours, avec une part significative du temps consacrée aux exercices.
Veuillez patienter