Descriptif
Ce cours explore le développement d'agents autonomes, c'est-à-dire des systèmes qui perçoivent, apprennent et agissent de manière indépendante pour atteindre des objectifs dans des environnements incertains et dynamiques. Il s'appuie sur les fondements de la prise de décision probabiliste, de l'inférence et de la planification. Nous développons les processus de décision de Markov et les concepts clés associés. Pour acquérir des agents autonomes, nous nous tournons principalement vers les algorithmes d'apprentissage par renforcement, notamment le Q-Learning profond (et ses variantes), les architectures Policy Gradient et Actor Critic. Nous étudions également des méthodologies telles que l'apprentissage basé sur les modèles, l'optimisation sans gradient, l'apprentissage par imitation et d'autres approches pour obtenir des agents capables de prendre des décisions séquentielles, telles que le contrôle basé sur les modèles et les transformateurs de décision. Nous abordons également des sujets connexes et spécialisés tels que l'apprentissage par renforcement hors ligne, l'apprentissage par renforcement distributionnel, ainsi que l'apprentissage par imitation et par renforcement inverse. Nous nous concentrons sur la construction d'algorithmes basés sur des architectures neuronales profondes modernes, qui permettent une évolutivité face à des problèmes concrets. Nous ne perdons pas de vue les implications pratiques des choix architecturaux et algorithmiques, et soulignons l'importance de bien formuler les problèmes d'agents autonomes et de prise de décision séquentielle. Les étudiants mettront en œuvre, étudieront et compareront des algorithmes dans différents contextes. Un projet de cours (50 %) constitue l'un des principaux éléments de notation, ainsi que des travaux pratiques (50 %).
36 heures en présentiel
Diplôme(s) concerné(s)
- M2 DATAAI - Data and Artificial Intelligence
- M1 DATAAI - Data and Artificial Intelligence
- M2 IGD - Interaction, Graphics and Design
- M1 IGD - Interaction, Graphics and Design
Parcours de rattachement
Format des notes
Numérique sur 20Littérale/grade réduitPour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 5 ECTS
Pour les étudiants du diplôme M1 IGD - Interaction, Graphics and Design
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 5 ECTS
Pour les étudiants du diplôme M2 IGD - Interaction, Graphics and Design
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 5 ECTS
Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 5 ECTS