Génomique
Reads courte séquence lue par le séquenceur.
k-mer taille d'une sous séquence.
configs séquence génomique continue résultant de l'assemblage de reads.
Scaffolds ensemble de contigs dont l’orientation et la taille des gaps est connue.
Unitigs aligenment de séquences non ambigues.
- Préparer ces séquences (preprocessing)
- Réaliser l'étude associée.
Warning
La préparation des séquences dépend de l'objectif.
Single ou paired-end. Les séquences sont lues par l'extrémité 5' et 3'.
Généralement, la méthode la plus utilisée (illumina) est
- Découpage du génomes : fragementation de la séquence.
- Ajout de deux amorces aux extrémités de la séquence : au début et à la fin.
- Amplification des fragments.
- Lecture de la séquence par chacune des deux extrémités.
Note
Généralement, la lecture est limitée à un nombre de bases après les amorces.
Warning
Il y a souvent des erreurs à la fin des reads.
Principales utilisations :
- Séquençage De novo : déterminer la séquence sans information préalable.
- Transcriptomique (ou ARN quantificition) quantifier le niveau d'expression des protéines.
- Métagénomique : lister les espèces et quantifier l'[[ADN]] d'un échantillon.
Prétraitement des données
Les principaux programmes permettant le prétraitement des séquences sont :
- trimmomatic
Séquencage de novo
Déterminer la génome d'un organisme.
Warning
Chez les Eucaryotes, les séquences répétés sont souvent plus grandes que celles des reads.
Alogrithmes d'assemblage
Deux types :
- gourmands. Une séquence est sélectionner puis elle est allongée au fur et à mesure.
-
basé sur la théorie des graphs deux types. Différence en fonction de la taille des k-mer :
- over lap liaison uniqument si un chevauchement. L'objectif est de trouvé le chemin le plus long. Le k-mer est la taille des reads k.
- découpage des séquences en k-mer possible (graph de debruyn). graphs
- over lap liaison uniqument si un chevauchement. L'objectif est de trouvé le chemin le plus long. Le k-mer est la taille des reads k.
- découpage des séquences en k-mer possible (graph de debruyn). graphs
Listes d'algorithmes :
- ABySS "Assembly By Short Sequences," programme de séquençage de novo conçu pour assembler des données de séquençage provenant de courtes lectures.
Graph de de Bruijn
- On créé un graph de tous les combinaisons de chevauchements possibles pour les k-mer (théorique).
- comparaison avec les séquences obtenues durant le séquençage.
Métagénomique
Lister les espèces présentes dans un échantillon.
Transcriptomique
La transcriptomique doit permettre de lister et quantifier l'[[ARN]] exprimer dans un tissu à un moment donnée.