Résumé
- les variables ;
- les structures de contrôle ;
- les listes, les chaînes de caractères, les dictionnaires ;
- les fichiers ;
- les expressions rationnelles.
Objectif(s)
Compétences et apprentissages visés
- Profesor: Benoist Gaston
- Profesor: Thierry Lecroq

Volume d'enseignement
Cours : 10h
TP : 10h
Nombre de Crédits Européens
2
Modalités de Contrôle des Connaissances et de Compétences
Épreuve écrite CM : 20%
Épreuve écrite TP : 80%
Contenu de l'Unité d'Enseignement
- le langage de structuration de pages Hyper Text Markup Language HTML5
- le langage de description de style Cascading Style Sheet CSS3
- les extensions de type Canvas, SVG, MathML, Highcharts/Googlecharts etc
- les formulaires utilisateurs et les actions serveur (essentiellement en PHP)
- le langage à balisage markdown (utilisation du façonneur pandoc, de codimd, du markdown de github etc)
- une introduction au langage côté client JavaScript
Compétences et connaissances acquises à l'issue de cette Unité d'Enseignement
À l'issue de cet enseignement, l'étudiant pourra :
- comprendre les mécanismes à mettre en œuvre pour la conception d'un site www simple
- modifier et étendre un site www existant
- Profesor: Laurent Mouchard

- Profesor: Marie Anglada

Volume d'enseignement
Cours : 8h
TP : 16h
Nombre de Crédits Européens
2
Modalités de Contrôle des Connaissances et de Compétences
Épreuve écrite TP : 100%
Contenu de l'Unité d'Enseignement
- environnement Linux et connexion à des serveurs distants avec ou sans VPN
- langage bash et son interface graphique yad
- aperçu des langages AWK et sed
- traitement de flux de données : présentation de certains pipelines (Nextflow, snakemake etc)
- machines virtuelles et containeurs : docker, singularity
Compétences et connaissances acquises à l'issue de cette Unité d'Enseignement
À l'issue de cet enseignement, l'étudiant pourra :
- créer ses propres scripts bash et modifier des scripts existants
- mettre en place une chaîne de traitement en utilisant un système de pipeline de type Nextflow ou snakemake ou autre
- utiliser docker de façon à travailler sur un container ou à créer un container
- Profesor: Laurent Mouchard
Programme et objectifs:
Ce module a pour objectif la maîtrise des outils d'analyse, calcul et visualisation de données en Python: NumPy, SciPy, Pandas et Matplotlib. Le module permettra aussi une première prise en main de la bibliothèque Scikit-learn pour une initiation pratique à l'utilisation des méthodes d'apprentissage automatique. Le cours intègre, pour chaque outil, un apprentissage des techniques de manipulation et de traitement de données, il est ensuite mis en application lors de travaux pratiques. Les cas d'études traduisent des problématiques du monde de la bio-informatique comme la manipulation des données du génome humain de référence ou de la classification d'espèces. L'objectif étant de concevoir des projets qui vont de l’importation et le prétraitement de données nécessaires jusqu'à la visualisation des résultats de l'analyse.
Modalités d'évaluation:
L'enseignement s'organise en CM et en TP en salle informatique. Le cours présente sa documentation essentiellement en langue anglaise. Il a lieu en présentiel (18h : 6h CM, 12h TP). L'UE est évaluée en contrôle continu intégral par travaux pratiques.
Pré-requis:
Programmation Python.
Compétences attestées :
- Maîtriser les bibliothèques Python d’exploration de données et de calcul scientifique.
- Manipulation avancée de séries, de tableaux de données hétérogènes et de tableaux de calcul.
- Collecter des données, les organiser, les traiter, et les transformer en informations exploitables.
- Identifier les caractéristiques structurantes des données, les transformer et les visualiser.
- Programmer et résoudre un problème d’optimisation numérique (linéaire, non linéaire). Interpréter les résultats.
- Choisir et mettre en œuvre les différents modèles d'apprentissage. Mesurer, comparer et analyser la qualité des prédictions.
- Profesor: Said Abdeddaim
Cet enseignement se structure en deux thèmes abordés sous forme de cours, TD et TP en salle informatique :
- Phylogénie moléculaire : Origine de la phylogénie et concepts de bases en phylogénie moléculaire ; Caractéristiques des arbres (topologie, enracinement) ; Premières phylogénies moléculaires (horloge moléculaire, choix de l'ARNr, arbre du vivant). Règles de reconstruction des arbres : choix des séquences, alignement multiple de séquences et méthodes de reconstruction d'arbres phylogénétiques ; Estimation de la robustesse d'un arbre ; Applications et limites de la phylogénie.
- Évolution des génomes : mécanismes moléculaires impliqués dans l'évolution de la structure et du contenu des génomes (duplications de génomes et de segments, duplication de gènes et fonction au sein des familles de protéines, implication des éléments mobiles, origine des introns); méthodes d’études (cartographie comparée, analyse de synténie, analyse comparative de séquences de génomes complets, outils et bases de données internationales de référence pour l'orthologie).
L'UE est évaluée en contrôle continu intégral par plusieurs devoirs écrits à la maison dans le cadre des TD ou TP (30%) et par deux devoirs sur table (70%), à part égale entre les deux parties . L'UE est obligatoire pour les parcours M1 BIMS et M1 MIC et est optionnelle pour le parcours M2CCB4. Pour le parcours BIMS ce cours est un pré-requis et sera réinvesti et approfondi sur les aspects algorithmiques et statistiques en M2 dans l'UE bioinformatique en génomique comparative.
- Profesor: Romain Coppee
- Profesor: Hélène Dauchel
- Profesor: Laurence Menu-Bouaouiche
Objectifs :
L'étudiant devra apprendre à maitriser la statistique bivariée tout d'abord en comprenant la notion de corrélation puis en s'appropriant les différentes étapes de la modélisation statistique, du choix du modèle à son utilisation en passant par la validation et la qualité de ce modèle.
Contenu :
_ Corrélation entre deux variables (Pearson, Spearman): notion et tests de corrélation.
_ Régression linéaire simple : les différentes étapes de la modélisation sur des exemples.
_ ANOVA : tests de comparaisons de plusieurs moyennes
_ Régression non-linéaire simple et problème de choix de modèles.
La totalité de l'enseignement se fera en salle machine en utilisant le logiciel R. L'enseignement se fera par des études de cas : présentation du problème biologique, du protocole expérimental et des données obtenues puis un traitement statistique.
- Profesor: Caroline Berard
Évaluation : Devoir Maison + CC écrit
Programme :
• Statistique exploratoire multidimensionnelle : ACP, AFC.
• Classification supervisée : arbres de décision, k-plus proches voisins.
• Classification non supervisée : Kmeans, CAH, Modèles de mélange.
• Mise en œuvre sous R. Manipulation du logiciel R, fonctions graphiques pour l'exploration et l'analyse de données.
Pré-requis :
• savoir : bases d'algèbre linéaire, diagonalisation de matrices, changement de bases.
• savoir-faire : logiciel R.
• équivalent UE existante : M1S1 Algèbre linéaire.
- Profesor: Caroline Berard
- Profesor: Hélène Dauchel
Programme : ce cours présente les enjeux de la médecine génomique personnalisée et le rôle essentiel de la bioinformatique dans ce contexte. En effet, depuis l’avènement du séquençage de nouvelle génération, le défi majeur en génétique médicale n’est plus l’identification des variations génétiques dans le génome des patients mais leur interprétation biologique et clinique. Les enseignements proposés dans le cadre de cette UE présentent les différents types de variations génétiques et leurs nomenclatures ainsi que les méthodes d’évaluation du caractère pathogène de ces variations (mutations constitutionnelles, altérations du nombre de copies, mutations somatiques et cancer). Ils intègrent la description de multiples approches expérimentales et bioinformatiques permettant d’appréhender l’impact fonctionnel des variations génétiques.
Modalités : cette UE s’organise en cours, en TD et en TP incluant la présentation de publications scientifiques récentes, de grandes ressources internationales et une sensibilisation aux questions éthiques en génomique. Elle est est évaluée en contrôle continu intégral, par deux travaux d'exposés (50%) et par un examen écrit sur table (50%). L'UE est obligatoire pour le parcours M1 BIMS et optionnelle pour le parcours M2CCB4.
Pré-requis : programme de génétique moléculaire eucaryote et procaryote et génie génétique de niveau licence SV d'un parcours moléculaire. Cette UE ne comprend pas de programmation informatique, il n'y a aucun pré-requis dans cette discipline.
A l'issue de ce cours les étudiants auront découvert l’importance des différentes bases de données mutationnelles et des grands projets internationaux de séquençage en génomique humaine. L’ensemble de ces enseignements doit aussi permettre aux étudiants d’acquérir des concepts génétiques et moléculaires fondamentaux dans le contexte de pathologies humaines. Au travers de cette UE combinée aux acquis de l'UE Génomique Transcriptomique, les étudiants disposeront de l'ensemble des connaissances pour aborder en pratique le traitement bioinformatique de données NGS en génomique des cancers (UE 3 Analyse de données de séquençage et annotations).
- Profesor: Hélène Dauchel
- Profesor: Pascaline Gaildrat