v2.11.0 (5776)

Mastère spécialisé - Big Data : gestion et analyse des données massives

Contexte

En 2020, le big data devrait représenter un marché mondial de 72 milliards de dollars1, principalement porté par les entreprises américaines du GAFA (Google, Apple, Facebook, Amazon). Mais la France a développé un écosystème qui la met en bonne position sur le podium mondial, grâce notamment à ses compétences en mathématiques et en informatique, ses formations scientifiques de haut niveau et aux incubateurs qui permettent à des milliers de start-up de se lancer.

LE BIG DATA : UN FUTUR INCONTOURNABLE
Aujourd’hui, l’intégration de ces technologies semble incontournable pour les entreprises engagées dans la transformation digitale. L’État français positionne le big data parmi ses 34 Plans pour la nouvelle France industrielle et table sur la création de 10 000 emplois directs d’ici 2020.

VERS DE NOUVEAUX MÉTIERS
Le big data appelle de nouveaux profils sur le marché de l’emploi, dotés de compétences techniques permettant d’imaginer des algorithmes et systèmes de gestion des données, afin d’en maîtriser les volumes, la vitesse et la
variabilité. Ces profils doivent aussi anticiper les nouveaux services et usages, et prendre en compte les aspects juridiques relatifs aux données personnelles.

Objectif

Savoir anticiper les nouveaux services et usages tout en prenant en compte les aspects juriques relatifs à la collecte, au stockage et à l'explotation des données personnelles.

contenu

Le programme s'appuie sur de nombreuses études de cas et des retours d’expérience, avec 4 périodes de formation sur 9 mois suivies d'un stage de 4 à 6 mois. Un projet professionnel Fil Rouge et des séminaires thématiques complètent le cursus.

Période 1
Systèmes répartis pour le Big Data, Statistique, Bases de données, Algorithmes distribués pour les grandes bases de données, Hadoop, Kit Data Science

Période 2
Machine Learning, NoSQL-NewSQL, Économie de l’Internet et Droit des données personnelles, Projet « Fil rouge »

Période 3
Sécurité informatique pour le Big Data, Économétrie pour le Big Data, Machine Learning avancé, Projet « Fil rouge »

Période 4
Données du web, Visualisation d’informations, l’Écosystème Big Data, Projet « Fil rouge »

Projet « Fil rouge »
Ce projet place un groupe d’étudiants en situation professionnelle pour mettre en pratique les connaissances acquises. Les projets sont proposés par de grandes entreprises comme EDF, GRDF, Capgemini, PSA Peugeot Citroën, UGC, Morpho ou des start-up comme Ownpage, ToucanToco, DCbrain, Yuzu, Kernix et portent des thématiques variées : e-réputation, recommandations de films, cartographie musicale, repérage des clients fragiles, attractivité d’un article de presse, prédiction de l’attrition (churn)… Ils portent toujours sur des données et des problématiques réelles des entreprises.

niveau requis

Titulaires d’un diplôme d’ingénieur en informatique ou en télécommunications, ou
Titulaires d’un Master 2 universitaire scientifique ou technique, en informatique ou en mathématiques appliquées, ou
Titulaires de diplômes étrangers de niveau équivalent à Bac+5, MSc ou MBA, en informatique ou mathématiques appliquées.

Un niveau d’anglais minimum est exigé : TOEIC de 700 au moins, TOEFL (Paper) de 550 au moins ou un niveau similaire d’un test équivalent.

Pré-requis
Il est fortement recommandé à tous les candidats de suivre le MOOC « Fondamentaux pour le Big Data »  et de joindre leurs résultats à leur dossier de candidature (notez que les résultats peuvent être transmis dans un second temps, après le dépôt du dossier complet).

Il est demandé aux candidats de maîtriser suffisamment les concepts ci-dessous pour être à l’aise dans leur utilisation.

- Mathématiques
Analyse : suites/séries numériques, éléments de calcul différentiel, éléments d’analyse de Fourier, d’analyse Hilbertienne
Algèbre : espaces vectoriels, applications linéaires, calcul matriciel, produits scalaires, formes quadratiques
Optimisation : multiplicateurs de Lagrange, descente de gradient
Statistique : expérience aléatoire, estimateur, risque, maximum de vraisemblance, moindres carrés, intervalles de confiance, tests statistiques
Probabilité : lois de probabilités, vecteurs aléatoires, loi/espérance conditionnelle, loi des grands nombres, théorème de la limite centrale, chaînes de Markov

- Informatique
Programmation en Java
Concepts de base : comment définir une variable, structures de contrôle : boucles for, for each, while
Classes et objets : comment définir une classe, les attributs, les méthodes ; concepts de public, private, protected ; différence entre une variable ou méthode static ou normale (non-static) ; l’héritage : comment étendre une classe (extends) ; les interfaces : comment définir une interface et l’implémenter dans une classe ; le polymorphisme : comment surcharger une méthode, comprendre comment marchent les méthodes surchargées
Bases de la bibliothèque standard de Java : collections (ArrayList, HashMap, HashSet, etc.) ; comment insérer un item dans une liste, supprimer un item au début, à la fin, ou au milieu ; quand utiliser les collections (par exemple, ArrayList versus LinkedList).
Comment prendre une description mathématique ou textuelle d’un algorithme et l’implémenter.
Programmation en Python
Maîtriser les concepts équivalents à ceux de Java ci-dessus (sauf public, private, protected et les interfaces)
Unix/Linux
Maîtriser les commandes de base

admission

Le processus de sélection comprendra deux étapes : analyse de dossier pour pré-sélection, puis entretien avec un jury constitué de membres de l’équipe pédagogique pour prise de décision.
Les candidats retenus sont ensuite soumis au jury d’admission qui émet la liste des admis définitive.

 

Le dépôt des candidatures se fait uniquement en ligne : Candidature en ligne
Votre dossier doit faire apparaître une vraie maîtrise de la programmation et des mathématiques présentées dans le MOOC. S’il est retenu, vous serez sollicité pour un entretien téléphonique. Si ce dernier est concluant, votre dossier sera étudié en jury.


Quatre jurys sont organisés tout au long de l’année, les dates limites de candidature sont indiquées en encadré. Il est conseillé de postuler aussi tôt que possible, notamment pour les étudiants étrangers et pour ceux ayant fait une demande de Fongécif. Les candidats sont informés de la réponse du jury de manière individualisée par mail. En cas d’admission, vous disposez pendant 10 jours d’une priorité d’inscription qui vous garantit une place.

vie étudiante

 

informations pratiques

Responsables du mastère
Marc Jeanmougin : marc.jeanmougin@telecom-paris.fr
Charlotte Laclau : charlotte.laclau@telecom-paris.fr


Modalités d'inscription et dates
Frais de dossier 150 €
Admission, dates limites, tarifs

 

 

commentaires complémentaires

Informations complémentaires

 

compétences acquises

Un professionnel du big data dispose de compétences techniques pointues : collecte, représentation, modélisation, analyse et traitement des données, intégration des contraintes de stockage distribué. Des connaissances  transversales sont également indispensables pour contribuer à la création de valeur et développer une vision d’ensemble stratégique. La sécurité et de la protection des données personnelles requièrent enfin une attention sur les aspects juridiques et les risques informatiques.

métiers

Data scientist
Architecte de système d’information big data
Chief data officer
Expert en data visualisation

atouts

- Rejoignez le secteur le plus stratégique de l’économie numérique
- Appréhendez les challenges économiques et juridiques du Big Data
- Mesurez l’impact de l’utilisation des algorithmes de Machine Learning
- Accompagnez votre entreprise dans les changements liés à l’exploitation de ses données

La notoriété du Mastère Spécialisé® Big Data de Télécom ParisTech est forte aussi bien auprès des grands groupes internationaux que des start-ups. Les étudiants reçoivent généralement plusieurs propositions de stage ou d’embauche au cours de leur formation.

Une dizaine d’entreprises (Thales, Safran, Airbus, Orange…) sont membres du comité de perfectionnement du Mastère Spécialisé® Big Data, ce qui permet que ses contenus restent toujours en adéquation avec les besoins des entreprises.

débouchés

Les professionnels de la donnée accèdent à des postes de data scientist, architecte de système d’information big data, chief data officer ou encore d’expert en data visualisation. Presque tous les secteurs d’activité sont désormais à la recherche de leurs compétences : finance, industrie, grande distribution, transports, assurance, santé, énergie, agriculture... et nombreux sont les métiers encore à inventer.

Parcours

Unités d'enseignement

UE Type d'enseignement Domaines Catégorie d'UE Credit Ects Volume horaire Responsables Periode de programmation Site pédagogique
BGD700 Bases de données Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 1 30 Louis JACHIET S1-P1
BGD701 Systèmes Répartis pour le Big Data Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 3 24 Remi SHARROCK S1-P1
BGD703 Exploration de grands volumes de données Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 2 24 Stephan CLEMENÇON,
Charlotte LACLAU,
Tiphaine VIARD
S1-P1
BGD704 Economie de l'Internet et des données personnelles Enseignement scientifique & technique Sciences économiques et sociales Enseignement de Mastère Spécialisé. 2 30 Patrick WAELBROECK S1-P2
BGD705 Bases de données non relationnelles Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 4 42 Charlotte LACLAU S1-P2
BGD706 Internet des objets BGD Enseignement scientifique & technique Enseignement de Mastère Spécialisé. 1 24 Keunwoo LIM S1-P2
BGD707 Sécurité pour le Big Data Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 2 24 Rida KHATOUN S1-P2
BGD708 Econométrie pour le Big Data Enseignement scientifique & technique Sciences économiques et sociales Enseignement de Mastère Spécialisé. 1 24 Patrick WAELBROECK S2-P3
BGD709 Données du Web Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 5 60 Antoine AMARILLI S2-P4
BGD710 Mise en pratique Données du Web Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 12 Antoine AMARILLI S2-P4
BGDIA700 Kit Big Data Enseignement scientifique & technique Mathématiques, Informatique Enseignement de Mastère Spécialisé. 1.5 18 Charlotte LACLAU S1-P1
BGDIA701 Statistiques Enseignement scientifique & technique Mathématiques Enseignement de Mastère Spécialisé. 3 45 Ekhine IRUROZKI ARRIETA S1-P1
BGDIA702 Intelligence artificielle et sciences des données : enjeu... Enseignement scientifique & technique Sciences économiques et sociales Enseignement de Mastère Spécialisé. 1.5 33 Winston MAXWELL S1-P1
BGDIA703 Apprentissage statistique et fouille de donnees Enseignement scientifique & technique Mathématiques Enseignement de Mastère Spécialisé. 5 87 Charlotte LACLAU S1-P2
BGDIA704 Machine learning avancé Enseignement scientifique & technique Mathématiques Enseignement de Mastère Spécialisé. 5 93 Charlotte LACLAU S2-P3
BGDIA705 Séminaires Enseignement scientifique & technique Informatique, Mathématiques Enseignement de Mastère Spécialisé. 0 39 Stephan CLEMENÇON,
Charlotte LACLAU,
François LAINÉE
S1-S2
BGDIA706 Projet Big Data Projets Informatique, Mathématiques Enseignement de Mastère Spécialisé. 3 36 Stephan CLEMENÇON,
Charlotte LACLAU
S1-S2
BGDIA707 Introduction au framework HADOOP Enseignement scientifique & technique Informatique Enseignement de Mastère Spécialisé. 2 30 Marc JEANMOUGIN S1-P1
IGR204 Visualisation Enseignement scientifique & technique Image-Données-Signal UE du créneau A. 3 24 James EAGAN S2-P4
Veuillez patienter