Séquence
Importer les bibliothèques
from Bio import SeqIO
from Bio import pairwise2
Déclarer des séquences
SeqIO.parse('alignement.fasta', "fasta")alignement du fichier fasta (renvoie un itérateur, à utiliser dans une boucle).Bio.Seq.Seq("sequence")déclarer une séquence.SeqIO.write(align(ali), "fichier.fasta", "fasta")exporter la séquence dans un fichier fasta.enumerate(seq)renvoie la position et la base.MutableSeq(genomeLambda.seq)rendre une séquence modifiable (from Bio.Seq import MutableSeq).
Propriétés des séquences :
annotations["organism"]accéder attribut d'une séquence accessiblesequence.ATTRIBUT.sequence.complement()renvoie la séquence complémentaire.sequence.reverse_complement()renvoie la séquence complémentaire inverse.sequence.transcribe()transcrire de l'ADN en ARN.sequence.translate()passer d'une séquence nucléotide à la séquence d'acides aminés.sequence.count("oligo")compter le nombre d'occurences.
Alignement des séquences
Bibliothèque Pairwise permet d'aligner des séquences deux à deux.
AlignIO.read(output_file, "fasta")importer des fastas d'alignement.AlignIO.write(alignment, "fichier.fasta", "fasta")exporter l'alignement en fasta.-
pairwise2.alignaligner des séquences. Les éléments sont accessibles en classe (ex :.id). L'alignement utilise comme algo :.globalms(seq1, seq2, 2, -1, -5, -2)algo globalms..globalxx(seq1, seq2)algo ?
BLAST
from Bio.Blast import NCBIWWW
from Bio.Blast import NCBIXML
NCBIWWW.qblast("blastp", "nr", query_sequence)nr pour non-redondanteNCBIXML.parse(result_handle)parcourir et analyser un fichier.
Visualiser les séquences
Libary pymsaviz
-
mv = MsaViz( fichier, wrap_length=60, show_count=True)Paramètre :show_consensus=Truecréer un consensus.
-
mv.savefig("api_example01.png")sauvegarder et afficher l'image dans un fichier.
Ajouter des fichiers :
mv.add_markers([30, (40, 50), 55], color = "green", marker = "+")ajouter des repères.mv.add_text_annotation((23, 39), "Libellé", text_color = "red", range_color = "red")ajouter un région.
Motif
from Bio import motifs
motifs.create([seq(), seq(), seq()])# créer un motifmotifs.read(open(chemin + "data/YAP3_MA0416.1.pfm", "r"), "jaspar")
Attributs :
motifPHO2.countsmatrice de comptagemotifPHO2.consensusrenvoie la séquence la plus probable.motifPHO2.degenerate_consensusW pour A ou T et V pour A, C, ou G
Afficher le motif
library seqlogo
seqlogo.CompletePm(pfm=pd.DataFrame(motifPHO2.counts), alphabet_type = 'DNA')calculerseqlogo.seqlogo(pfm, format='png', size='medium')créer la représentation graphique (display(graph)pour l'afficher).