Documents généraux de l'année et canal d'échange

Contenu de l'Unité d'Enseignement

  • Introduction aux systèmes d'exploitation
  • Introduction aux réseaux :
    • topologie ;
    • connexions distantes (ssh, sftp, scp...).
  • Le système d'exploitation Linux et le bash (Bourne-Again SHell) :
    • le terminal et les lignes de commandes ;
    • les redirections des entrées/sorties, les tubes ;
    • le bash et sa programmation :
      • manipulation des variables ;
      • structures de tests ;
      • structures itératives ;
      • fonctions ;
      • interfaçage yad (préféré à zenity ou kdialog)
    • génération d'un rapport automatique au format markdown, puis HTML et PDF à partir d'un fichier d'un million de lignes.

Compétences et connaissances acquises à l'issue de cette Unité d'Enseignement

Un étudiant ayant validé cette UE sera capable :

  • d'utiliser Linux sur une machine locale ou via une connexion distante : au travers d'une connexion sécurisée ssh ou un VPN ;
  • développer des scripts de façon à automatiser des traitements ;
  • gérer de gros flux de données texte.

Contenu de l'Unité d'Enseignement

Cet enseignement présente un certain nombre de concepts de Technologies Web :

  • le langage de structuration de pages Hyper Text Markup Language HTML5
  • le langage de description de style Cascading Style Sheet CSS3
  • les extensions de type Canvas, SVG, MathML, Highcharts/Googlecharts etc
  • les formulaires utilisateurs et les actions serveur (essentiellement en PHP)
  • le langage à balisage markdown et son façonneur pandoc
  • une introduction au langage côté client JavaScript

Compétences et connaissances acquises à l'issue de cette Unité d'Enseignement

À l'issue de cet enseignement, l'étudiant pourra :

  • comprendre les mécanismes à mettre en œuvre pour la conception d'un site www simple
  • modifier et étendre un site www existant

Contenu de l'Unité d'Enseignement :

  • Introduction aux bases de données (avec l'exemple MySQL) :
    • notions de entité/association (entity/relationship) ;
    • étude d'une base de données contenant une table :
      • requêtes simples ;
      • requêtes avec clauses simples et complexes (COUNT, GROUP BY, HAVING...) ;
      • modification de la structure de la table ;
    • étude d'une base de données contenant plusieurs tables :
      • clé primaire et clé étrangère ;
      • associations 1,n et n,n : tables de jointure
    • transactions ;
    • fonctions et procédures stockées ;
    • déclencheurs ;
    • table temporaire, vue, index ;
    • accès à MySQL via les connecteurs python :
      • utilisation de mysql.connector ;
      • couplage avec pandas ;
      • génération de documents HTML à partir des données lues.

Compétences et connaissances acquises à l'issue de cette Unité d'Enseignement

Un étudiant ayant validé cette UE sera capable :

  • d'utiliser une base de données existantes pour les tâches courantes ;
  • de programmer de petites fonctions et procédures stockées ;
  • interroger une base de données à l'aide du langage de programmation Python et de post-traiter les données.

Objectifs :

L'étudiant devra apprendre à maitriser la statistique bivariée tout d'abord en comprenant la notion de corrélation puis en s'appropriant les différentes étapes de la modélisation statistique, du choix du modèle à son utilisation en passant par la validation et la qualité de ce modèle.

Contenu :

_ Corrélation entre deux variables (Pearson, Spearman): notion et tests de corrélation.

_ Régression linéaire simple : les différentes étapes de la modélisation sur des exemples.

_ ANOVA : tests de comparaisons de plusieurs moyennes

_ Régression non-linéaire simple et problème de choix de modèles.

La totalité de l'enseignement se fera en salle machine en utilisant le logiciel R. L'enseignement se fera par des études de cas : présentation du problème biologique, du protocole expérimental et des données obtenues puis un traitement statistique.

Programme: ce cours présente les approches et technologies de séquençage et d'hybridation à très haut-débit qui permettent d'explorer les génomes, métagénomes, transcriptomes et régulomes. Quelque soit le domaine du vivant (microorganisme, végétal, animal, humain) ces technologies révolutionnent les connaissances fondamentales en biologie moléculaire (contenu des génomes, régulation de l'expression des génomes) et trouvent des applications en agrosciences (agro-génomique), environnement (éco-génomique) ou en médecine génomique (génomique des cancers, des maladies complexes, médecine personnalisée). Ce cours intègre la présentation des démarches et outils bioinformatiques et biostatistiques nécessaires au traitement des masses de données issues de ces grands projets d'exploration moléculaire des mécanismes du vivant.

Modalités : l'enseignement s'organise en CM, en TD (exercices, lectures d'articles) et en TP en salle informatique (découverte des ressources internationales sur le web). Ce cours présente sa documentation essentiellement en langue anglaise. Il a lieu en présentiel (35h : 23h CM, 8h TD, 4h TP). L'UE est évaluée en contrôle continu intégral, par diverses travaux collectifs ou individuels; travaux dirigés, travaux pratiques et examen sur table. L'UE est obligatoire pour les deux parcours de la mention bionformatique (M1 BIMS, M2CCB4), pour le M1 mention Microbiologie et est optionnelle pour le M1 mention  Agrosciences EcobioValo.

Pré-requis : programme de génétique moléculaire eucaryote et procaryote et génie génétique de niveau licence SV d'un parcours moléculaire. Cet UE ne comprend pas de programmation informatique, il n'y a aucun pré-requis dans cette discipline. Sur le plan des statistiques, ce cours fait appel aux connaissances en statistiques des tests.

A l'issue de ce cours les étudiants sont capables 1/ de se repérer dans le paysage général des approches haut débit et des applications en génomique, de comprendre leur évolution, potentiel et limitation 2/ de lire et comprendre dans des articles de diverses applications les objectifs, matériels et méthodes expérimentales et bioinformatiques/biostatistiques ainsi que les différentes figures de résultats des étapes (contrôle qualité, chaine de traitement, annotation, visualisation); 3/ d'identifier et d'utiliser les banques de données internationales du domaine et un genome browser. 4/ Les étudiants de la mention bioinformatique disposeront de l'ensemble des connaissances pré-requises pour aborder en pratique le traitement bioinformatique de données NGS (UE 3 analyse de données de séquençage et annotations).  

Cet enseignement se structure en deux thèmes abordés sous forme de cours, TD et TP en salle informatique :

  • Phylogénie moléculaire : Origine de la phylogénie et concepts de bases en phylogénie moléculaire ; Caractéristiques des arbres (topologie, enracinement) ; Premières phylogénies moléculaires (horloge moléculaire, choix de l'ARNr, arbre du vivant). Règles de reconstruction des arbres : choix des séquences, alignement multiple de séquences et méthodes de reconstruction d'arbres phylogénétiques ; Estimation de la robustesse d'un arbre ; Applications et limites de la phylogénie.
  • Évolution des génomes : mécanismes moléculaires impliqués dans l'évolution de la structure et du contenu des génomes (duplications de génomes et de segments, duplication de gènes et fonction au sein des familles de protéines, implication des éléments mobiles, origine des introns); méthodes d’études (cartographie comparée, analyse de synténie, analyse comparative de séquences de génomes complets, outils et bases de données internationales de référence pour l'orthologie).

L'UE est évaluée en contrôle continu intégral par deux devoirs écrits à la maison (20%) et par deux devoirs sur table (80%). L'UE est obligatoire pour les parcours M1 BIMS  et M1 MIC et est optionnelle pour le parcours M2CCB4. Pour le parcours BIMS ce cours est un pré-requis et sera réinvesti et approfondi sur les aspects algorithmiques et statistiques en M2 dans l'UE bioinformatique en génomique comparative.