Descriptif
Ce cours présente l’apprentissage par renforcement (algorithmes de bandits, processus de décision markoviens, TD-learning, Q-learning, deep Q-learning) et son application à un cas d'usage réel (recommandation de produits).
24 heures en présentiel (16 blocs ou créneaux)
Diplôme(s) concerné(s)
- Data & Artificial Intelligence
- Programme de mobilité des établissements français partenaires
- Data Science
- Echange international non diplomant
- Diplôme d'ingénieur
Parcours de rattachement
Pour les étudiants du diplôme Data & Artificial Intelligence
Probability theory Python programming
Pour les étudiants du diplôme Echange international non diplomant
Probability theory Python programming
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme Echange international non diplomant
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Diplôme d'ingénieur
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
- Crédit d'Option 3A acquis : 2
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Data Science
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme Data & Artificial Intelligence
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.