Enseignement scientifique & technique - IA318 : Reinforcement learning

Domaine > Informatique.

Descriptif

Ce cours présente l’apprentissage par renforcement (algorithmes de bandits, processus de décision markoviens, TD-learning, Q-learning, deep Q-learning) et son application à un cas d'usage réel (recommandation de produits).

24 heures en présentiel (16 blocs ou créneaux)

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Data & Artificial Intelligence

Probability theory Python programming

Pour les étudiants du diplôme Echange international non diplomant

Probability theory Python programming

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Echange international non diplomant

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2 ECTS

L'UE est partiellement acquise si Note finale >=

Crédits ECTS acquis : 2 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Diplôme d'ingénieur

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2 ECTS
Crédit d'Option 3A acquis : 2

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Data Science

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Data & Artificial Intelligence

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 2.5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Mots clés

apprentissage par renforcement, bandits, Q-learning

Veuillez patienter

Plan du site

Accueil
Les formations

Mentions légales