v2.11.0 (5932)

Enseignement scientifique & technique - APM_4AI04_TP : Analyse des signaux de musique et de parole : méthodes et applications

Domaine > Image-Données-Signal.

Descriptif

Ce cours propose de parcourir, depuis les bases méthodologiques et théoriques jusqu'aux applications, les domaines du traitement de la parole et des signaux audio-fréquences. Les signaux de parole et de musique sont un type de données disponibles en masse sur le web. Leur analyse est une étape primordiale à l'indexation, qui permet ensuite aux sites de réseaux sociaux d'organiser, d'agréger ces contenus. Les données de parole jouent également un rôle central dans les applications dites de speech analytics et d'interaction humain-machine (google voice, siri). Enfin, le traitement des signaux audio-fréquences donne lieu actuellement à de nombreux développements dont la plupart touchent notre vie quotidienne (musique, home studio, home cinema).

Objectifs pédagogiques

Acquis d'apprentissage
À l'issue de l'UE, l'élève sera capable de:
- Décrire les mécanismes de perception et de production de la parole
- Réaliser un système de synthèse et de reconnaissance automatique de la parole
- Contrôler indépendamment l’échelle temporelle et l’échelle fréquentielle d’un signal de parole ou de musique
- Identifier et mettre en œuvre une méthode de séparation de sources audio dans un contexte applicatif donné
- Décrire et mettre en œuvre des méthodes d’apprentissage profond pour l'audio


Compétences de rattachement (et justification)
- BC5.1 – Modéliser mathématiquement une situation, des données, des phénomènes physiques dans le contexte du numérique; Justification : L'UE amène les élèves à utiliser des modèles de signaux spécifiques à la parole et à la musique.
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : L'UE amène les élèves à concevoir différents systèmes de traitement de données audio, dans le cadre de diverses applications à la parole et à la musique.

24 heures en présentiel (16 blocs ou créneaux)

24 heures de travail personnel estimé pour l’étudiant.

effectifs minimal / maximal:

8/30

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Echange international non diplomant

Les cours obligatoires de la filière SPAI au P1, P2 et P3 constituent une préparation suffisante à ce cours.

Pour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence

Les cours obligatoires de la filière SPAI au P1, P2 et P3 constituent une préparation suffisante à ce cours.

Pour les étudiants du diplôme Diplôme d'ingénieur

Les cours obligatoires de la filière SPAI au P1, P2 et P3 constituent une préparation suffisante à ce cours.

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme M1 DATAAI - Data and Artificial Intelligence

Vos modalités d'acquisition :

L’évaluation est basée sur deux éléments :
• Pour chaque session de travaux pratiques, il sera demandé de rédiger un court rapport en anglais dans lequel vous décrirez la conception des méthodes, leur mise en œuvre, les problèmes rencontrés, ainsi que votre réflexion sur où se trouvent les difficultés.
• Rédigez une note de lecture (4-5 pages) en anglais sur un article de votre choix, en présentant le problème abordé, la méthodologie, le modèle de calcul et expliquer les avantages et inconvénients de la méthode proposée.

Note : Travaux pratiques (sur 10 points) + note de lecture d’article (sur 10 points). Validation pour Note >=10.

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS

Pour les étudiants du diplôme Echange international non diplomant

Vos modalités d'acquisition :

L’évaluation est basée sur deux éléments :
• Pour chaque session de travaux pratiques, il sera demandé de rédiger un court rapport en anglais dans lequel vous décrirez la conception des méthodes, leur mise en œuvre, les problèmes rencontrés, ainsi que votre réflexion sur où se trouvent les difficultés.
• Rédigez une note de lecture (4-5 pages) en anglais sur un article de votre choix, en présentant le problème abordé, la méthodologie, le modèle de calcul et expliquer les avantages et inconvénients de la méthode proposée.

Note : Travaux pratiques (sur 10 points) + note de lecture d’article (sur 10 points). Validation pour Note >=10.

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

L’évaluation est basée sur deux éléments :
• Pour chaque session de travaux pratiques, il sera demandé de rédiger un court rapport en anglais dans lequel vous décrirez la conception des méthodes, leur mise en œuvre, les problèmes rencontrés, ainsi que votre réflexion sur où se trouvent les difficultés.
• Rédigez une note de lecture (4-5 pages) en anglais sur un article de votre choix, en présentant le problème abordé, la méthodologie, le modèle de calcul et expliquer les avantages et inconvénients de la méthode proposée.

Note : Travaux pratiques (sur 10 points) + note de lecture d’article (sur 10 points). Validation pour Note >=10.

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS
  • Crédit d'UE électives acquis : 2.5

La note obtenue rentre dans le calcul de votre GPA.

L'UE est évaluée par les étudiants.

Programme détaillé

- Perception et production de la parole

- Reconnaissance automatique de la parole : principe, fonctionnement et méthode de reconnaissance

- Synthèse de la parole

- Séparation de sources

- Modifications temporelles et spectrales

- NMF (Non-Negative Matrix Factorization) pour le traitement de signaux audio 

- l'apprentissage profond pour l'audio

 

 

 

Mots clés

traitement du signal audio, traitement des signaux musicaux, interactions vocales, traitement de la parole, apprentissage profond

Méthodes pédagogiques

Leçons, travaux dirigés, travaux pratiques
Veuillez patienter