v2.11.0 (5747)

Enseignement scientifique & technique - TSIA206 : Analyse des signaux de musique et de parole : méthodes et applications

Domaine > Image-Données-Signal.

Descriptif

Ce cours propose de parcourir, depuis les bases méthodologiques et théoriques jusqu'aux applications, les domaines du traitement de la parole et des signaux audio-fréquences. Les signaux de parole et de musique sont un type de données disponibles en masse sur le web. Leur analyse est une étape primordiale à l'indexation, qui permet ensuite aux sites de réseaux sociaux d'organiser, d'agréger ces contenus. Les données de parole jouent également un rôle central dans les applications dites de speech analytics et d'interaction humain-machine (google voice, siri). Enfin, le traitement des signaux audio-fréquences donne lieu actuellement à de nombreux développements dont la plupart touchent notre vie quotidienne (musique, home studio, home cinema).

Objectifs pédagogiques

A l'issue de ce cours, les étudiants maîtriseront les différentes méthodes de traitement du signal et d'apprentissage automatique spécifiques à l'analyse et à la classifications des signaux de parole et de musique. 

24 heures en présentiel (16 blocs ou créneaux)

24 heures de travail personnel estimé pour l’étudiant.

effectifs minimal / maximal:

8/30

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Diplôme d'ingénieur

Les cours obligatoires de la filière TSIA au P1, P2 et P3 constituent une préparation suffisante à ce cours.

Pour les étudiants du diplôme Echange international non diplomant

Les cours obligatoires de la filière TSIA au P1, P2 et P3 constituent une préparation suffisante à ce cours.

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Diplôme d'ingénieur

Vos modalités d'acquisition :

Pour chaque session de travaux pratiques, rédigez un court rapport en anglais dans lequel vous décrirez la conception des méthodes, leur mise en œuvre, les problèmes rencontrés, ainsi que votre réflexion sur où se trouvent les difficultés.

Rédigez une note de lecture (4-5 pages) en anglais sur un article de votre choix, en présentant le problème abordé, la méthodologie, le modèle de calcul et expliquer les avantages et inconvénients de la méthode proposée.

Note : Travaux pratiques (coeff. 1) + note de lecture d’article (coeff. 2)

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS
  • Crédit d'UE électives acquis : 2.5

La note obtenue rentre dans le calcul de votre GPA.

L'UE est évaluée par les étudiants.

Pour les étudiants du diplôme Echange international non diplomant

Vos modalités d'acquisition :

Pour chaque session de travaux pratiques, rédigez un court rapport en anglais dans lequel vous décrirez la conception des méthodes, leur mise en œuvre, les problèmes rencontrés, ainsi que votre réflexion sur où se trouvent les difficultés.

Rédigez une note de lecture (4-5 pages) en anglais sur un article de votre choix, en présentant le problème abordé, la méthodologie, le modèle de calcul et expliquer les avantages et inconvénients de la méthode proposée.

Note : Travaux pratiques (coeff. 1) + note de lecture d’article (coeff. 2)

L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 2.5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Programme détaillé

- Perception et production de la parole

- Reconnaissance automatique de la parole : principe, fonctionnement et méthode de reconnaissance

- Traitement des signaux socio-émotionnels 

- Synthèse de la parole

- Séparation de sources

- Modifications temporelles et spectrales

- NMF (Non-Negative Matrix Factorization) pour le traitement de signaux audio 

- vers la multimodalité en musique : analyse du geste musical

- l'apprentissage profond pour l'audio

 

 

 

Mots clés

traitement du signal audio, traitement des signaux musicaux, interactions vocales, traitement de la parole, apprentissage profond

Méthodes pédagogiques

Leçons, TD, TP
Veuillez patienter