Aller au contenu

Informatique

Séquence

gdemare/informatique

Informatique

gdemare/informatique

Home
Informatique
Untitled
SAS
SAS
- automatiser avec SAS
- Centroïdes
- Formater les données
- Manipuler les données
- Statistique
  Statistique
  - ANOVA
  - Graphique
  - Probabilité et statistique
  - Tests statistiques
  - Clustering
    Clustering
    
    CAH
    
    Centres mobiles
    
    Clustering des variables
  - Modèles
    Modèles
    
    Analyse discriminante
    
    Arbre de decision
    
    Espérance maximisation
    
    Régression linéaire
    
    Régression logistique
  - Réduction de dimensions
    Réduction de dimensions
    
    ACM
    
    ACP
    
    AFC
Bioinformatique
Bioinformatique
- Bioinformatique
- Séquences
Database
Database
- Fichier
  Fichier
  - Json
- Langage
  Langage
  - Sql
- Logiciel
  Logiciel
  - Business object
  - Talend
Logiciels et os
Logiciels et os
- OS
- Ressources web
- écran AERI
- Logiciels
  Logiciels
- Os
  Os
  - Android
  - Liens logiciel
  - Ubuntu
  - Windows
  - Liseuse
Programmation
Programmation
- Bonnes pratiques de programmation
- Git
- Java
- Unix
  Unix
- Web
  Web
  - Css
  - Html
  - Java script
  - Php
Python
Python
- Bases
  Bases
  - Dataframe
  - Formater les données
  - Python
  - Ressources
  - Tenseur
  - Divers
    Divers
    
    Cartographie
    
    Modules supplémentaires
    
    Streamlit
    
    Traitement d images
    
    Traitement du signal
    
    Web scraping
- Bioinformatique
  Bioinformatique
  - Spectrométrie
  - Séquence Séquence
    Table des matières
    
    Déclarer des séquences
    
    Alignement des séquences
    
    BLAST
    
    Visualiser les séquences
    
    Motif
    
    Afficher le motif
- Clustering
  Clustering
  - CAH
- Math
  Math
- Modèles
  Modèles
  - Arbre décision
  - Modèles
  - Régression
  - Réseau de neurones
    Réseau de neurones
    
    Pytorch
    
    TensorFlow
    
    Couche convulsive
- Réduction de dimensions
  Réduction de dimensions
  - ACP
R
R
- Bases
  Bases
  - PKNCA et les unités
  - R
  - Cinétique
  - Dataframe
  - Format
  - Ressources
  - Autres
    Autres
    
    Carte
    
    Diagramme
    
    Développer
    
    Rapport
    
    Tableau de bord
- Bioinformatique
  Bioinformatique
- Descriptions
  Descriptions
  - Graphiques
  - Clustering
    Clustering
    
    CAH
    
    Centres mobiles
    
    Clustering
  - Réduction de dimensions
    Réduction de dimensions
    
    ACM
    
    ACP
    
    AFC
    
    Positionnement multidimensionnel
- Mathématique
  Mathématique
  - Probabilité statistique
- Models
  Models
  - Classification
  - Prédiction
  - Préparer les données
  - Régression
  - Réseau de neurones
  - Classification
    Classification
    
    ANOVA
    
    Support Vecteur Machine
    
    Analyse discriminante
    
    Arbre de décision
    
    Classificateur baysien
    
    Forêt aléatoire
    
    Régression logistique
  - Régression
    Régression
    
    Régression linéaire
    
    Step
  - Séries temporelles
    Séries temporelles
    
    Série temporelle simple

Séquence

Importer les bibliothèques

from Bio import SeqIO
from Bio import pairwise2

Déclarer des séquences

SeqIO.parse('alignement.fasta', "fasta") alignement du fichier fasta (renvoie un itérateur, à utiliser dans une boucle).
Bio.Seq.Seq("sequence") déclarer une séquence.
SeqIO.write(align(ali), "fichier.fasta", "fasta") exporter la séquence dans un fichier fasta.
enumerate(seq) renvoie la position et la base.
MutableSeq(genomeLambda.seq) rendre une séquence modifiable (from Bio.Seq import MutableSeq).

Propriétés des séquences :

annotations["organism"] accéder attribut d'une séquence accessible sequence.ATTRIBUT.
sequence.complement() renvoie la séquence complémentaire.
sequence.reverse_complement() renvoie la séquence complémentaire inverse.
sequence.transcribe() transcrire de l'ADN en ARN.
sequence.translate() passer d'une séquence nucléotide à la séquence d'acides aminés.
sequence.count("oligo") compter le nombre d'occurences.

Alignement des séquences

Bibliothèque Pairwise permet d'aligner des séquences deux à deux.

AlignIO.read(output_file, "fasta") importer des fastas d'alignement.
AlignIO.write(alignment, "fichier.fasta", "fasta") exporter l'alignement en fasta.
pairwise2.align aligner des séquences. Les éléments sont accessibles en classe (ex : .id). L'alignement utilise comme algo :
- .globalms(seq1, seq2, 2, -1, -5, -2) algo globalms.
- .globalxx(seq1, seq2) algo ?

BLAST

from Bio.Blast import NCBIWWW from Bio.Blast import NCBIXML

NCBIWWW.qblast("blastp", "nr", query_sequence) nr pour non-redondante
NCBIXML.parse(result_handle) parcourir et analyser un fichier.

Visualiser les séquences

Libary pymsaviz

mv = MsaViz( fichier, wrap_length=60, show_count=True) Paramètre :
- show_consensus=True créer un consensus.
mv.savefig("api_example01.png") sauvegarder et afficher l'image dans un fichier.

Ajouter des fichiers :

mv.add_markers([30, (40, 50), 55], color = "green", marker = "+") ajouter des repères.
mv.add_text_annotation((23, 39), "Libellé", text_color = "red", range_color = "red") ajouter un région.

Motif

from Bio import motifs

motifs.create([seq(), seq(), seq()]) # créer un motif
motifs.read(open(chemin + "data/YAP3_MA0416.1.pfm", "r"), "jaspar")

Attributs :

motifPHO2.counts matrice de comptage
motifPHO2.consensus renvoie la séquence la plus probable.
motifPHO2.degenerate_consensus W pour A ou T et V pour A, C, ou G

Afficher le motif

library seqlogo

seqlogo.CompletePm(pfm=pd.DataFrame(motifPHO2.counts), alphabet_type = 'DNA') calculer
seqlogo.seqlogo(pfm, format='png', size='medium') créer la représentation graphique (display(graph) pour l'afficher).