Formateamos las bases de datos de fasta indicdas en la seccion anterior para Blast. Se encuentran en /scratch/BlastDB.
![]() | Los modulos del programa blast se encargan de definir de manera automatica la variable BLASTDB a este directorio. |
Las bases tienen estos nombres , para utilizar com la opcion -db de blast:
nt : nucleotide sequence database.
nr : non-redundant protein sequence database with entries from GenPept, Swissprot, PIR, PDF, PDB, and RefSeq
swissprot : swiss-prot database (last major release)
XX-in-nt-50bp : Secuencias nucleotidos de bacteria, fungi, human o virus , secuencias >= 50bp
XX-in-nr-50bp : Proteinas de bacteria, fungi, human o virus , secuencias >= 50bp
Por ejemplo, para buscar secuencias de nucleotidos relacionados con bacterias, utilizaria la linea de comando siguiente:
$ blastn -db bacteria-in-nt-50bo -query mifastafile ... |