PÔLE ANALYSE de DONNÉES

 

Formation

Ateliers Cluster

Prochaines séances: niveau 1 le lundi 13 janvier (9h-12h) et niveau 2 le mercredi 15 janvier (9h-12h)

PCIA organise une formation à l'utilisation du cluster de calcul composée de deux modules  :

Niveau 1:  Les bases de l'utilisation d'un cluster.

Ce module permet aux personnes sans aucune connaissance de l'utilisation d'un serveur Linux à distance d'effectuer les actions de base nécessaires à l'utilisation du cluster :

  • Se connecter au cluster avec un client SSH et y transférer ses fichiers
  • Utiliser les commandes UNIX de base
  • Éditer des fichiers texte et exécuter des scripts.

Niveau 2: Travailler avec le cluster PCIA.

Il s'adresse aux personnes ayant suivi le niveau 1 ainsi qu'à celles travaillant déjà sous Linux ou ayant déjà utilisé un autre calculateur Unix :

  • Description du cluster
  • Le gestionnaire de ressources SLURM
  • L'utilisation des modules

Ateliers Imagerie numérique

Prochaines séances: niveau 1 le lundi 24 février 2020 (9h-12h et 14h-17h) et niveau 2 le mardi 25 février 2020 (9h-12h et 14h-17h) en salle informatique de phanérogamie

  • Niveau 1:  Les bases de l'imagerie numérique.

Cette formation vise à familiariser les participants avec la manipulation et le traitement d'images numériques. Description théorique de l'information contenue dans une image numérique : notions de pixel, de résolution, de calibration, de contraste, description des différents formats... Améliorer la visualisation : notions d'histogramme, de seuillage, de fausses couleurs... Transformer les images : changement d'échelle, transformations géométriques, binarisation, conversion...

  • Niveau 2 : Utilisation avancée d'ImageJ.

Cette formation vise à présenter des fonctionnalités avancées du logiciel ImageJ pour l'analyse d'images numériques. Correction d'images : filtrage, rehaussement de contours... Mesures et analyses d'objets : quantification, gestion de régions d'intérêt Visualisation et gestion des piles d'images : images 3D (stacks), images multi-canaux (hyperstacks) Installation et utilisation des macros et des plugins.

Ateliers Génétique et Génomique

Assemblage de séquences d'amplicons obtenues par multiplexage à deux niveaux
27 février, 10h-16h

Bien que plus large, cet atelier correspond plus particulièrement à l’analyse de données brutes produites dans le cadre des séquençages réguliers de « pools d’amplicons » proposés par le SSM (Service de Systématique Moléculaire, UMS 2700) et est piloté par Agnès Dettaï (MC, ISYEB)
Une première partie (10h-12h environ) présentera le séquençage, l'assemblage, et la vérification d'amplicons "tout-venant" : amplicons relativement courts de gènes mitochondriaux, nucléaires, etc.
La deuxième partie (à partir de 14h) se concentrera sur les mitogénomes et les séquences longues incluant plusieurs marqueurs, et leurs problèmes particuliers. En fonction de vos connaissances/ attentes, vous pouvez donc ne venir qu'à la demie-journée qui vous intéresse!
Prérequis : Aucun

 

Initiation à Linux et à la ligne de commande
28 février, 9h00-16h00

Cet atelier à pour but de vous familiariser avec l’environnement de travail LINUX et la ligne de commande (arborescence de fichier Linux, BASH, travail sur serveur distant…). Bien que cet atelier soit pertinent quel que soit votre domaine de travail, les exemples seront orientés vers l’analyse de données génomiques.
Prérequis: Aucun

 

Introduction aux données génomiques
13 mars, 9h00-16h00

Cet atelier présente un aperçu théorique des technologies de séquençage à haut débit et leurs applications en génomiques. Métagénomique, transcriptomique, épigénétique, phylogénie, etc.
Prérequis: Aucun

 

 

Initiation à la plateforme d’analyse « GALAXY »

GALAXY est une plateforme avec interface web intégrant de nombreux outils bioinformatiques, orientée vers la génomique (mais pas seulement !...). Elle permet de créer et de partager des procédures d'analyses à travers un environnement libre, assez intuitif et modulable.
Plus d'informations sur https://galaxyproject.org/
Les participants seront familiarisés avec l'environnement de travail GALAXY, ses principes et son fonctionnement. Ils seront capables de transférer leurs données, de lancer des outils d'analyses individuellement ainsi que de les organiser en "pipeline".
Prérequis: Aucun

 

Programmation avec Python pour débutants, niveau 1

Cet atelier présente les bases de la programmation avec Python, actuellement l’un des plus populaires langages de programmation. Expressions, types des données, variables, fonctions, instructions conditionnelles avec if, règles de bonnes pratiques.
Prérequis: Aucune

 

Programmation avec Python pour débutants, niveau 2

Cet atelier aborde des notions plus approfondies de la programmation avec Python. Séquences, slicing et opérations sur les séquences, listes, instructions répétitives avec while et for, scripts.
Prérequis: <<Programmation avec Python pour débutants, niveau 1>> ou connaissances basiques de la programmation avec python.

 

Introduction aux analyses ChIP-Seq

Cet atelier présente un aperçu des approches ChIP-Seq, qui ont pour but l’étude des interactions entre protéines et ADN. Nous y aborderons le type de données et les outils d’analyses existants.
Prérequis: <<Initiation à Linux>> ou connaissances de Linux. Conseillé: <<Introduction aux données génomique>> ou connaissances basiques de Chip-Seq.

 

Introduction aux analyses RAD-Seq

L'approche RADseq est aujourd'hui un choix récurrent, aussi bien pour des études intra/péri-spécifiques que pour des études inter-spécifiques pour des temps de divergence raisonnables.
Cette journée a pour but de reprendre les bases théoriques de l'approche et de ses mises en œuvre possibles d'un point de vue expérimental. Les différents protocoles de génération de banques RAD seront abordés. En ce qui concerne l'analyse de données RAD, un bilan des différents pipelines sera réalisé et les participants seront amenés à appliquer les pipelines choisis sur des jeux de données qui leur seront fournis.
Prérequis: <<Initiation à Linux>> ou connaissances de Linux. Conseillé: <<Introduction aux données génomique>> ou connaissances basiques de RAD-Seq.

Ateliers Statistiques sous R

Les ateliers ont pour vocation de présenter pas à pas l’utilisation de statistiques avec le logiciel R. Chaque atelier se déroulera sur une journée maximum ou 1/2 journée pour un nombre maximum de 8 participants et sont ouverts à tout le personnel du MNHN (chercheurs, IT, étudiants…). Ce sera l’occasion pour les participants d’échanger et d’apporter un cas concret.

  • Atelier Initiation à R: première session le 25 février 2020
    Importation de données, variables, manipulation d'objets, graphiques ...
     
  • Atelier Statistiques descriptives sous R: le 17 mars 2020 (matin)
  • Inscription (avant le 6 mars) : https://framaforms.org/inscription-atelier-statistiques-descriptives-avec-r-1580992525
    Indicateurs de position et de dispersion d’une série statistique
    Variable quantitative : description et représentation graphique
    Variable qualitative : description et représentation graphique
    Statistiques descriptives bivariées
    Quelques graphiques avec le package ggplot2
  • Atelier Quelques tests statistiques sous R: le 23 avril 2020
    Principe du test statistique
    Quelques tests paramétriques (comparaison de moyennes : le test de Student, le test du khi2)
    Quelques tests non paramétriques (comparaison de médianes, test exact de Fisher)