v2.11.0 (5762)

Filières de 2e année - SD : Filière Science des données (créneau C)

Domaine > Mathématiques, Informatique.

Descriptif

Responsables de la filière : Mauro Sozio (domaine Gestion de données), François Portier (domaine Apprentissage Statistique)
Responsable mobilité internationale :
Stéphan Clémençon
Coordination des stages : Olivier Fercoq et Hicham Janati

La filière est enseignée en anglais.

La filière Science des données couvre l'ensemble des domaines liés à l'exploitation, la gestion et l'analyse de grands volumes de données, structurées et non structurées.

La filière vous propose d’explorer les grands volumes de données, de comprendre et analyser les données.
Les cours associent théorie et pratique grâce à un bon équilibre entre TD de maths et TP en salle informatique. Vous développerez vos connaissances en bases de données, développement web, statistiques et apprentissage statistique.

Des exemples de débouchés naturels sont les métiers de « data scientist » ou analyste des données, d'ingénieur statisticien, d'administrateur de bases de données, ou les domaines de recherche et R&D en apprentissage statistique, gestion de données, extraction de données, fouille de données, mathématiques de l'apprentissage.

En savoir plus...

2e année
La filière se divise en deux spécialisations : •
- Apprentissage Statistique (à l'intersection entre informatique et mathématiques) •
- Gestion de Données (informatique)
Les étudiants suivront en 2e année 6 unités d'enseignement communes, et 2 autres spécifiques (au P3 et P4) selon leur choix d'option.


  P1 P2 P3 P4

C1

SD 201

Mining of large Datasets

SD-TSIA 204

Statistics : linear models

SD-TSIA 210

Machine learning

SD 212

Graph Mining

C2

SD 202

Data Bases

SD-TSIA 211

Optimization for Machine Learning

SD-TSIA 205

Advanced Statistics

-----OU-----

SD 206

Logic and Knowledge representation

SD-TSIA 214

Machine Learning for Text Mining

------OU-----

SD 213

Symbolic Natural Language Processing

 

 
UE du créneau D d'UE partagées
  • Le module MDI 210 Optimisation devra être suivi en P1 (prérequis pour SD 211). MDI210 doit être suivi obligatoirement en P1 ; cependant, en cas d'incompatibilité avec une UE requise par une autre filière suivie, et seulement dans ce cas, MDI210 peut être suivi en P3 (cela pourra rendre plus difficile le suivi de certains cours de la filière SD).
  • MDI 220 Statistiques  en P1 (obligatoire)
  • INF 224 Paradigmes de programmation (recommandé)

Options de 3e année

Option interne

Faire une option interne à l'école :

  • Option interne SD science de données
  • Option interne IA Intelligence Artificielle (en partenariat avec l'ENSTA)
Master M2 Spécialisation Apprentissage : Master M2
  • M2 parcours Data Sciences (mention Mathématiques et applications) - IP Paris
  • M2 parcours MVA : Mathématiques, Vison et Apprentissage (mention Mathématiques et applications) - IP Paris
  • M2 parcours Data and Artificial Intelligence (mention Informatique) - IP Paris
  • M2 parcours MICAS (mention E3A) - IP Paris
Spécialisation Gestion de Données : Master M2 :
  • M2 parcours DataScale : Gestion de données dans un monde numérique (mention informatique) - IP paris
  • M2parcours Data and Artificial Intelligence (mention Informatique) - IP Paris
Formation à l’étranger

Suivre une formation équivalente à l'étranger (contacter le responsable mobilité internationale)

Autre

Vous pouvez aussi choisir, après la 2e année,  de suivre en 3eA  :

  • un cursus transverse, c'est à dire ouvert quelle que soit la filière choisie en 2e année : Option interne Quantum Engineering,  ou un des M2 transverses du domaine SES (PIC / IREN / COSI)
  • une mobilité en France dans une école de l'Institut Mines-Télécom ou de ParisTech.

Pré-requis

UE créneaux D partagés pour la filière : Statistiques (MDI220), Optimisation (MDI210) au P1 et Paradigmes de programmation (INF224) recommandé

Modalités d'acquisition

La filière est validée si la moyenne des notes finales est ≥ 10 et si vous obtenez au minimum 15 crédits ECTS.

Composition du parcours

    SD201 SD202 SD-TSIA204 SD-TSIA211 SD-TSIA210 SD212 SD-TSIA205 SD206 SD213 SD-TSIA214

Unités d'enseignement

UE Type d'enseignement Domaines Catégorie d'UE Volume horaire Responsables Site pédagogique
SD-TSIA204 Statistics: linear models/Statistique : modèles linéaires Enseignement scientifique & technique Mathématiques UE du créneau C. 24 Ekhine IRUROZKI ARRIETA
SD-TSIA205 Advanced Statistics/Statistique avancée (Option Apprentis... Enseignement scientifique & technique Mathématiques UE du créneau C, SD Apprentissage statistique. 24 Stephan CLEMENÇON
SD-TSIA210 Machine Learning Enseignement scientifique & technique Mathématiques UE du créneau C. 24 Matthieu LABEAU
SD-TSIA211 Optimization for Machine Learning Enseignement scientifique & technique Mathématiques SD Apprentissage statistique, UE du créneau C. 24 Olivier FERCOQ
SD-TSIA214 Machine Learning for Text Mining (option apprentissage st... Enseignement scientifique & technique Mathématiques SD Apprentissage statistique. 24 Chloe CLAVEL,
Matthieu LABEAU
SD201 Mining of Large Datasets/Exploration des grands volumes d... Enseignement scientifique & technique Informatique UE du créneau C. 24 Mauro SOZIO,
Tiphaine VIARD
SD202 Databases / Bases de données Enseignement scientifique & technique Mathématiques UE du créneau C. 24 Antoine AMARILLI,
Louis JACHIET
SD206 Logic and Knowledge Representation/Logique et représentat... Enseignement scientifique & technique Informatique SD Gestion de données, UE du créneau C. 24 Jean-Louis DESSALLES
SD212 Graph Learning Enseignement scientifique & technique Mathématiques, Informatique UE du créneau C. 24 Thomas BONALD
SD213 Cognitive approach to Natural Language Processing (Option... Enseignement scientifique & technique Informatique UE du créneau C, SD Gestion de données. 24 Jean-Louis DESSALLES
Veuillez patienter