Descriptif
This course presents techniques of reinforcement learning (Markov decision processes, TD-learning, Q-learning, bandit algorithms, Monte-Carlo Tree Search) and their application to real use cases (games, content recommendation).
24 heures en présentiel (16 blocs ou créneaux)
Diplôme(s) concerné(s)
- Data Science
- Programme de mobilité des établissements français partenaires
- Interaction, Graphic & Design
- Data & Artificial Intelligence
- Diplôme d'ingénieur
- Echange international non diplomant
Parcours de rattachement
Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires
Probability theory Python programming
Pour les étudiants du diplôme Data & Artificial Intelligence
Probability theory Python programming
Pour les étudiants du diplôme Diplôme d'ingénieur
Probability theory Python programming
Pour les étudiants du diplôme Echange international non diplomant
Probability theory Python programming
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme Interaction, Graphic & Design
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
Pour les étudiants du diplôme Echange international non diplomant
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Diplôme d'ingénieur
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
- Crédit d'Option 3A acquis : 2.5
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Data & Artificial Intelligence
Vos modalités d'acquisition :
Quiz
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Data Science
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Programme détaillé
- Markov Decision Process
- Dynamic programming
- Online evaluation
- Online control
- Value approximation
- Bandit algorithms
- Contextual bandit