Descriptif
Objectifs pédagogiques
Acquis d'apprentissage
À l'issue de ce module, l'élève sera capable de:
- Expliquer les difficultés liées au traitement des données textuelles langagières et aux tâches associées.
- Expliquer les méthodes de représentation numérique du texte, et les méthodes basiques de traitement du texte pour des tâches classiques.
- Décrire les éléments menant au succès de l'utilisation de modèles neuronaux pour la représentation et le traitement du langage écrit.
- Mettre en œuvre des méthodes (traditionnelles et premières approches neuronales) sur un éventail de tâches simples, à l'aide de python et de manipulation de librairies spécialisées (NLTK, Gensim, Scikit-learn)
Compétences de rattachement (et justification)
- BC5.1 – Modéliser mathématiquement une situation, des données, des phénomènes physiques dans le contexte du numérique; Justification : Dans l'étude des méthodes de représentations du langage naturel sous forme textuelle.
- BC5.3 – Structurer, dimensionner un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : Dans l'étude des choix architecturaux des modèles pour le traitement du texte.
- BC5.4 – Tester, gérer un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : Dans la mise en œuvre des principales méthodes non-neuronales des tâches classiques de traitement automatique du langage.
Diplôme(s) concerné(s)
- Echange international non diplomant
- Diplôme d'ingénieur
- Echange international non diplomant
- Diplôme d'ingénieur
UE de rattachement
- CSC_4SDS2_TP : Filière Data Science & Artificial Intelligence (créneau C) - Semestre 2,
- APM_4AIS2_TP : Filière Signal Processing & Artificial Intelligence (créneau C) - Semestre 2
Pour les étudiants du diplôme Diplôme d'ingénieur
Students are supposed to follow SD-TSIA 210 Machine learning
Pour les étudiants du diplôme Diplôme d'ingénieur
Students are supposed to follow SD-TSIA 210 Machine learning
Format des notes
Numérique sur 20Pour les étudiants du diplôme Diplôme d'ingénieur
Vos modalités d'acquisition :
L'évaluation est basée sur deux éléments:
- Des TP notés, à rendre à la fin de la séance pour évaluer la mise en œuvre des méthodes,
- Un examen final écrit pour évaluer les autres acquis.
- le rattrapage est obligatoire si :
- Note initiale < 10
Le coefficient de l'UE est : 1
Pour les étudiants du diplôme Echange international non diplomant
Vos modalités d'acquisition :
L'évaluation est basée sur deux éléments:
- Des TP notés, à rendre à la fin de la séance pour évaluer la mise en œuvre des méthodes,
- Un examen final écrit pour évaluer les autres acquis.
- le rattrapage est obligatoire si :
- Note initiale < 10
Le coefficient de l'UE est : 1
Programme détaillé
The techniques and concepts that will be studied include:
-Text pre-processing and representation : tokenization, document representation and word embeddings; how they can be used for classical NLP tasks.
- An introduction to non-neural Language models.
- HMM and their application to NLP tasks.
- A first application of simple neural models to text representation.