Se acaba de instalar la version ultima de R-project, 4.4.2.
Revisen por favor la pagina de los programas para tener mas informaciones!
Feliz año nuevo a todos
Se acaba de instalar la version ultima de R-project, 4.4.2.
Revisen por favor la pagina de los programas para tener mas informaciones!
Feliz año nuevo a todos
Se realizo una nueva base de datos en fasta y para blast de las secuenicas de nt y nr de virus, sin Sars-Cov-2 (taxid: 2697049 ).
Se llaman virusSinSARS-in-n[rt]. Se encuentran en /scratch/DB y /scratch/BlastDB
Buen trabajo!
Se informa que las bases de datos para Blast de los “clados” de NCBI en nucletidos y proteinas estan actualizados:
Se encuentran en /scratch/Blastdb. Les recuerdo que los modules de blast definen automaticmente el valor de BLASTDB a este directorio!
Ipyrad se instalo en el cluster, en su version 0.9.99. Es un programa para an interactive assembly and analysis toolkit for restriction-site associated DNA (RAD-seq) and related data types .
Revisan la documentacion el linea para saber como utilizarlo!
Gracias a Jorge Alexander Rojas Vargas por agradecer al cluster en su recientes articulos :
Comprehensive comparative analysis of the periodontal
pathogen Porphyromonas gingivalis: exploring the
pan-genome, the reconstruction of the gene regulatory
network and genome-scale metabolic network
y
A comparative genomic study of a
hydrocarbon-degrading marine bacterial
consortium
Lo agradecemos con su apoyo!
Se instalo el programa VEP que permite predecir los efectos de SNPs.
Este programa esta instalado via Singularity. chequen la documentacion del module para verificar como usarlo correctamente:
$ module help programs/vep-112
Se instalo tambien el programa multiqc: “a reporting tool that parses results and statistics from bioinformatics tool outputs, such as log files and console outputs.”
Buen trabajo!
Se instalo pharokka en el cluster, con su base de datos correspondiente.
Pharokka es “a rapid standardised annotation tool for bacteriophage genomes and metagenomes.”
Se define con el module la variable PHARODB que indica la ubicacion de la base de datos.
Se instalo la ultima version de SPAdes 4.0.0:
St. Petersburg genome assembler – a versatile toolkit designed for assembling and analyzing sequencing data from Illumina and IonTorrent technologies.
Pueden encontrar mas informacion aqui .
Se instalo la última versión de Qiime2: 2024.5 :
QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results.
Se instalo con un ambiante conda, por lo que se requierre algunas etapas siguiente: activar conda, luego activar el ambiente qiime2:
$ module load programs/qiime2-2024.5
$ source /share/apps/External/Miniconda3-23.11.0/bin/activate
$ conda activate qiime2-2024.5
$ qiime --version
q2cli version 2024.5.0
Run `qiime info` for more version details.
Por otra parte, hare una encuesta pronto para ver la utilidad de conservar las versiones anteriores de qiime2: 2019.X
Acabamos de realizar una clusterizacion de la base de datos de nr (proteinas de NCBI), al 90% de identidad. Para ello se uso el programa MMseq2 para tal tarea.
Se pudo llegar a reducir de 56% el tamaño original de la bd:
Este archivo clusterizado se formateo para Blastp, con mismo nombre: nr-clust.
Espero que eso les ayude en sus investigacion.
PD: estamos tratando de realizar lo mismo con los nucleotidos.