Descriptif
This course presents techniques of reinforcement learning (Markov decision processes, TD-learning, Q-learning, bandit algorithms, Monte-Carlo Tree Search) and their application to real use cases (games, content recommendation).
24 heures en présentiel (16 blocs ou créneaux)
Diplôme(s) concerné(s)
- M2 DS - Data Science
- Programme de mobilité des établissements français partenaires
- Echange international non diplomant
- M2 DATAAI - Data and Artificial Intelligence
- Diplôme d'ingénieur
- M1 DATAAI - Data and Artificial Intelligence
Parcours de rattachement
Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires
Probability theory Python programming
Pour les étudiants du diplôme Echange international non diplomant
Probability theory Python programming
Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence
Probability theory Python programming
Pour les étudiants du diplôme Diplôme d'ingénieur
Probability theory Python programming
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
Pour les étudiants du diplôme M2 DS - Data Science
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Diplôme d'ingénieur
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
- Crédit d'Option 3A acquis : 2.5
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Echange international non diplomant
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Programme détaillé
- Markov Decision Process
- Dynamic programming
- Online evaluation
- Online control
- Value approximation
- Bandit algorithms
- Contextual bandit