v2.11.0 (5932)

Enseignement scientifique & technique - CSC_5AI27_TP : Large-scale Generative Models for NLP and Speech Processing

Domaine > Informatique.

Descriptif

Natural language processing has given rise to innumerable industrial applications. While many new tasks have emerged in NLP and speech processing over the last decades, methods to solve them have increasingly converged towards a unified modeling paradigm. In this course, we will use large-scale generative models and sequence-to-sequence modeling to delve into state-of-the-art statistical machine learning methods and apply them to major NLP and speech processing tasks — language modeling, machine translation, speech recognition, information extraction. Students should expect to get an in-depth understanding of these methods, through theoretical analysis and hands-on lab sessions. Grading will involve a project, to be carried out over the course of the class. Topics to be covered:
1. Language Modeling
2. Speech to Text
3. Extracting Structured Information from Text
4. Machine Translation
5. Code Generation

Objectifs pédagogiques

Acquis d'apprentissage
À l'issue de l'UE, l'élève sera capable de:
- Concevoir une solution à un problème de NLP ou traitement de la parole à l'aide d'outils de l'état de l'art, et concevoir son évaluation
- Analyser et critiquer un système de NLP ou traitement de la parole, sur le plan technique et scientifique
- Décrire et défendre sur le plan scientifique une solution technique dans un exposé oral et un rapport écrit

Compétences de rattachement (et justification)
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : Les étudiants réalisent un projet d'application dont l'objet est précisément la conception d'un système de NLP ou traitement de la parole, pour résoudre un problème typique de ce domaine.
- BC6.2 – S’appuyer sur la modélisation mathématique pour évaluer les performances et les limites du système et de ses composants, de manière à mettre en évidence les facteurs de dimensionnement et d’architecture; Justification : Le projet des étudiants comporte un volet d'évaluation de leur propre solution. IA327 demande aux étudiants d'être critiques vis-à-vis des critères d'évaluation choisis, et il leur est demandé de justifier leurs choix et de faire preuve de rigueur.
- BC4.2 Documenter l’état de l’art se rapportant à un domaine spécifique des sciences du numérique dans au moins deux langues; Justification : Dans ce projet d'application et dans nos exigences, nous nous orientons aux standards internationaux de publication scientifique. Documenter l'état de l'art en fait naturellement partie.

Format des notes

Numérique sur 20

Littérale/grade américain

Pour les étudiants du diplôme Echange international non diplomant

Vos modalités d'acquisition :

- TP
- Projet final : soutenance et rapport

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2 ECTS

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

- TP
- Projet final : soutenance et rapport

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2 ECTS
  • Crédit d'Option 3A acquis : 2

Pour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence

Vos modalités d'acquisition :

- TP
- Projet final : soutenance et rapport

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS

Pour les étudiants du diplôme M2 DATAAI - Data and Artificial Intelligence

Vos modalités d'acquisition :

- TP
- Projet final : soutenance et rapport

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS

Pour les étudiants du diplôme Programme de mobilité des établissements français partenaires

Vos modalités d'acquisition :

- TP
- Projet final : soutenance et rapport

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2 ECTS
  • Crédit d'Option 3A acquis : 2

Mots clés

Natural Language Processing, Speech Processing, Intelligence Artificielle, apprentissage automatique

Méthodes pédagogiques

Chaque cours est suivi d'un TP, mettant en application le contenu du cours. Grâce à cela, les étudiants sont confrontés à une variété de problèmes et de méthodes de résolution. Cette année, nous avons eu la chance d'avoir un intervenant du monde de l'industrie pour 2 de nos TP, donnant à nos TP une pertinence particulière pour ces étudiants proches de la diplomation. Enfin, les étudiants sont évalués sur un projet d'application, dont le sujet est libre. L'évaluation (soutenance et rapport) met l'accent sur les capacités de synthèse, de réflexion, d'argumentation, de rigueur scientifique et de communication scientifique des étudiants.

Support pédagogique multimédia

Oui

Veuillez patienter