Descriptif
Cours en anglais
Nous commencerons dans ce cours par traiter le modèle linéaire simple (des moindres carrés) avant de présenter le cadre général qui englobe entre autre la régression logistique.
Par la suite, nous considérerons les problèmes d'estimation et de tests dans ces modèles.
Enfin dans une dernière partie nous présenterons la problématique de la sélection de variables dans un tel contexte, en nous appuyant principalement sur la régularisation/pénalisation L1 (Lasso) et sur les méthodes de sélection gloutonnes (ou « greedy » en anglais).
Nous commencerons dans ce cours par traiter le modèle linéaire simple (des moindres carrés) avant de présenter le cadre général qui englobe entre autre la régression logistique.
Par la suite, nous considérerons les problèmes d'estimation et de tests dans ces modèles.
Enfin dans une dernière partie nous présenterons la problématique de la sélection de variables dans un tel contexte, en nous appuyant principalement sur la régularisation/pénalisation L1 (Lasso) et sur les méthodes de sélection gloutonnes (ou « greedy » en anglais).
Objectifs pédagogiques
Acquis d'apprentissageÀ l'issue de l'UE, l'élève sera capable de:
- Modéliser mathématiquement des données et des processus physiques, et être capable d'extraire des informations pertinentes et de la connaissance à travers des outils statistiques.
- Développer un modèle d'apprentissage à partir de données, avec un test honnête en tenant compte des limitations informatiques.
Compétences de rattachement (et justification)
- BC5.1 – Modéliser mathématiquement une situation, des données, des phénomènes physiques dans le contexte du numérique; Justification : Les étudiants apprennent à formuler des modèles linéaires, à sélectionner les variables explicatives appropriées et à les valider avec des données réelles.
- BC5.2 – Concevoir un système de traitement de données, d’intelligence artificielle, d’apprentissage machine dans un objectif d’aide à la décision ou de recherche automatique d’information; Justification : Le cours permet aux étudiants d'apprendre à concevoir un système de traitement de données et d'apprentissage machine pour le cas particulier des relations linéaires entre variables en utilisant des techniques qui sont communes ou transversales à tout système d'IA ou de traitement de données.
24 heures en présentiel (16 blocs ou créneaux)
réparties en:
- Travaux Pratiques : 6
- Travaux Dirigés : 3
- Leçon : 12
- Contrôle de connaissance : 3
Diplôme(s) concerné(s)
Parcours de rattachement
Pour les étudiants du diplôme Diplôme d'ingénieur
MDI220 Statistiques (tronc commun)
Notions dinférence statistique de base
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme Diplôme d'ingénieur
Vos modalités d'acquisition :
L’évaluation est basée sur un examen final écrit pour vérifier l’acquisition des connaissances théoriques et statistiques, ainsi qu'un travail dirigé noté pour évaluer la capacité des élèves à développer et tester un programme.
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
- Crédit d'UE électives acquis : 2.5
La note obtenue rentre dans le calcul de votre GPA.
L'UE est évaluée par les étudiants.
Pour les étudiants du diplôme Echange international non diplomant
Vos modalités d'acquisition :
L’évaluation est basée sur un examen final écrit pour vérifier l’acquisition des connaissances théoriques et statistiques, ainsi qu'un travail dirigé noté pour évaluer la capacité des élèves à développer et tester un programme.
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 2.5 ECTS
La note obtenue rentre dans le calcul de votre GPA.
Programme détaillé
Méthodes pédagogiques
Les concepts clés sont présentés en cours magistral et mis en application en TD ou en TP suivant leur nature.Ressources : polycopié + bibliographie disponible au CRDN