Home Hardware Networking Programmazione Software Domanda Sistemi
Conoscenza Informatica >> Programmazione >> Perl Programming >> .

Come estrarre le voci da più Fasta

FASTA è un formato basato su testo utilizzato in bioinformatica per rappresentare sequenze , soprattutto quelle di nucleotidi e peptidi , con coppie di basi rappresentata da una singola lettera . Una sequenza FASTA consiste in una descrizione riga singola , contraddistinta da una "maggiore di " simbolo sulla prima riga , seguito da una sequenza nucleotidica o peptidica più linee . È possibile estrarre sequenze multiple da un file FASTA utilizzando moduli speciali, o componenti aggiuntivi , per il linguaggio di programmazione Perl , noto come BioPerl , che sono stati appositamente sviluppati per gestire il formato FASTA . È anche possibile codificare manualmente uno script Perl per abbinare i modelli in un file o di utilizzare altri strumenti disponibili per estrarre sequenze FASTA . Cose che ti serviranno
FASTA file di
Perl Editor
BioPerl
ActiveState Perl
Biopieces
Show More Istruzioni
1

Avviare il Perl applicazione editore . Si può utilizzare un semplice editor di testo , ad esempio Blocco note . È necessario salvare il file con estensione " . Pl " per indicare che si tratta di un programma Perl .
2

Estrarre una sequenza da un file di più FASTA eseguendo pattern- matching Perl , digitando il codice riportato di seguito in all'editor:

# /usr /bin /perlmy $ fasta_seq = shift; my $ sequenza = shift; my $ file di lavoro = `cat $ fasta_seq ` ; my ($ fasta_seq ) = ! $ file di lavoro = ~ /( > $ sequenza [ ^ > ] + ) /s ; print $ fasta_seq ;
3

estrarre le sequenze dal file FASTA utilizzando BioPerl . È possibile estrarre sequenze multiple digitando il codice riportato di seguito in all'editor:

# /bin /perl - w

uso Bio :: SeqIO ;

$ sequenceobject = Bio ! :: SeqIO - > new ( - file = > " fasta_file_path " , - format = > " FASTA " ) ;

Il Bio :: modulo SeqIO fornisce l'elaborazione sequenza senza soluzione di continuità . È possibile recuperare una singola sequenza utilizzando la seguente istruzione :

$ retrievedsequence = $ sequenceobject - > next_seq ;

È possibile scorrere l'oggetto e recuperare più sequenze , come segue :

while ( $ retrievedsequence = $ sequenceobject - > next_seq ) {print $ retrievedsequence - > seq , " \\ n"; }
4

estrarre le sequenze dal file FASTA utilizzando il applicazione " Biopieces ", che è quadro che contiene una serie di strumenti modulari per la manipolazione dei dati bioinformatica . Si esegue il comando Biopieces alla riga di comando

read_fasta -i fasta_file

 

Programmazione © www.354353.com