Ce cours donne des éléments de base de l'analyse des données et de la modélisation descriptive, ainsi que des principes à mettre en œuvre pour traiter des applications réelles. Une introduction à la modélisation décisionnelle avec des réseaux de neurones est également présentée. L'analyse des données et la modélisation descriptive aident à comprendre les données empiriques issues de phénomènes naturels, économiques ou socio-culturels. Cette compréhension facilite la mise en œuvre de méthodes performantes de construction de modèles décisionnels. Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, les enquêtes d'opinion, le marketing, la gestion de la relation client, la climatologie, la sécurité, etc. L'enseignement adopte une approche pragmatique, les séances de travaux pratiques permettant la mise en œuvre systématique des méthodes présentées. Les unités d'enseignement RCP209 « Apprentissage statistique : modélisation décisionnelle et apprentissage profond », RCP211 «Intelligence artificielle avancée » et RCP217 «Intelligence artificielle pour des données multimédia » sont des suites recommandées de RCP208.
Applications, nature des problèmes de modélisation et spécificités des données
Analyse des données, réduction de dimension : méthodes factorielles
Classification automatique
Estimation de densités
Cartes de Kohonen
Imputation des données manquantes
Classement et régression sans construction de modèle
Perceptrons multi-couches pour le classement et la régression
Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant la plateforme Scikit-learn. Une introduction au langage Python et à Scikit-learn est prévue lors des premières séances de TP.
Analyse des données, réduction de dimension : méthodes factorielles
Classification automatique
Estimation de densités
Cartes de Kohonen
Imputation des données manquantes
Classement et régression sans construction de modèle
Perceptrons multi-couches pour le classement et la régression
Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant la plateforme Scikit-learn. Une introduction au langage Python et à Scikit-learn est prévue lors des premières séances de TP.