Programme et objectifs:
Ce module a pour objectif la maîtrise des outils d'analyse, calcul et visualisation de données en Python: NumPy, SciPy, Pandas et Matplotlib. Le module permettra aussi une première prise en main de la bibliothèque Scikit-learn pour une initiation pratique à l'utilisation des méthodes d'apprentissage automatique. Le cours intègre, pour chaque outil, un apprentissage des techniques de manipulation et de traitement de données, il est ensuite mis en application lors de travaux pratiques. Les cas d'études traduisent des problématiques du monde de la bio-informatique comme la manipulation des données du génome humain de référence ou de la classification d'espèces. L'objectif étant de concevoir des projets qui vont de l’importation et le prétraitement de données nécessaires jusqu'à la visualisation des résultats de l'analyse.
Modalités d'évaluation:
L'enseignement s'organise en CM et en TP en salle informatique. Le cours présente sa documentation essentiellement en langue anglaise. Il a lieu en présentiel (18h : 6h CM, 12h TP). L'UE est évaluée en contrôle continu intégral par travaux pratiques.
Pré-requis:
Programmation Python.
Compétences attestées :
- Maîtriser les bibliothèques Python d’exploration de données et de calcul scientifique.
- Manipulation avancée de séries, de tableaux de données hétérogènes et de tableaux de calcul.
- Collecter des données, les organiser, les traiter, et les transformer en informations exploitables.
- Identifier les caractéristiques structurantes des données, les transformer et les visualiser.
- Programmer et résoudre un problème d’optimisation numérique (linéaire, non linéaire). Interpréter les résultats.
- Choisir et mettre en œuvre les différents modèles d'apprentissage. Mesurer, comparer et analyser la qualité des prédictions.
- Enseignant: Said Abdeddaim





