UE APM_5AI18_TP | Catalogue 2024-2025

Descriptif

This course presents techniques of reinforcement learning (Markov decision processes, TD-learning, Q-learning, gradient methods, bandit algorithms, Monte-Carlo Tree Search) and their application to real use cases (games, content recommendation).

24 heures en présentiel (16 blocs ou créneaux)

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

Probability theory Python programming

Pour les étudiants du diplôme Echange international non diplomant

Probability theory Python programming

Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence

Probability theory Python programming

Pour les étudiants du diplôme Diplôme d'ingénieur

Probability theory Python programming

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Echange international non diplomant

Vos modalités d'acquisition :

Quiz

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS

L'UE est partiellement acquise si Note finale >=

Crédits ECTS acquis : 2 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

Vos modalités d'acquisition :

Quiz

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

Quiz

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS
Crédit d'Option 3A acquis : 2.5

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence

Vos modalités d'acquisition :

Quiz

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme M2 DS - Data Science

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS

Pour les étudiants du diplôme Auditeurs libres des cycles ingénieurs IP Paris

Programme détaillé

Markov Decision Process
Dynamic programming
Online evaluation
Online control
Gradient methods
Bandit algorithms
Parametric bandits

Mots clés

Reinforcement learning, bandits

Méthodes pédagogiques

Lecture + Quiz + Lab

Enseignement scientifique & technique - APM_5AI18_TP : Reinforcement learning

Domaine > Informatique.

Descriptif

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

Pour les étudiants du diplôme Echange international non diplomant

Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence

Pour les étudiants du diplôme Diplôme d'ingénieur

Format des notes

Pour les étudiants du diplôme Echange international non diplomant

Vos modalités d'acquisition :

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

Vos modalités d'acquisition :

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence

Vos modalités d'acquisition :

Pour les étudiants du diplôme M2 DS - Data Science

Pour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence

Pour les étudiants du diplôme Auditeurs libres des cycles ingénieurs IP Paris

Programme détaillé

Mots clés

Méthodes pédagogiques

Plan du site