SqueezeMeta es una tubería completamente automática para metagenómica/metatranscriptómica, cubriendo todos los pasos del análisis..
SqueezeMeta está licenciado como open source, concretamente GNU GPL. Mirar en referencias más abajo.
Para poder usar SqueezeMeta una vez logueado en drago.csic.es tendrá que cargar los siguientes módulos en mismo orden.
module unuse /dragofs/sw/campus/0.2/modules/all/Core
module unuse /dragofs/sw/restricted/0.2/modules/all/Core
module load foss/2021b
module load SqueezeMeta/1.5.0
module load rama0.3 Mamba/23.1.0-4
conda create -n SqueezeMeta -c conda-forge -c bioconda -c fpusan squeezemeta=1.6 --no-channel-priority --override-channels
De esta manera descargaremos SqueezeMeta en nuestro home.
Para que SqueezeMeta funcione correctamente debemos modificar el fichero $HOME/.conda/envs/SqueezeMeta/SqueezeMeta/scripts/SqueezeMeta_conf_original.pl
Modificar el en bloque #-- External software la linea donde aparece minimap2_soft
Para configurar las bases de datos del repositorio de Drago y no consumir cuota se aconseja ejecutar:
configure_nodb.pl /lustre/databases/SqueezeMeta/db
Para activar nuestro entorno de SqueezeMeta y que no de fallos de minimap:
(base) .....
(base) .....module load rama0.3
(base) .....module load GCCcore/11.3.0
(base) .....module load minimap2/2.24
(base) ..... conda activate SqueezeMeta
(SqueezeMeta) .....
Recordar tener activado el entorno de SqueezeMeta antes de lanzar el script.
#SBATCH -p generic # Particion elegida para el trabajo(cola)
#SBATCH -N 1 # Numero de nodods solicitados
#SBATCH -n 20 # Numero de cores(CPUs)
#SBATCH --mem=80G # memoria total solicitada
#SBATCH -t 0-10:00:00 # Duracion solicitada para el trabajo (D-HH:MM:SS)
#SBATCH --job-name=squeeze # Nombre del trabajo
#SBATCH -o squeeze-%j.out # fichero de salida estandart
###################################################################################################################
################################# DESPLIEGUE DEL SOFTWARE A UTILIZAR #############################################
###################################################################################################################
# Limpiamos los posibles modulos que tengamos cargados previamente para evitar problemas
module purge
# Cargamos los modulos necesarios para ejecutar el trabajo
module load rama0.3
module load GCCcore/11.3.0
module load minimap2/2.24
###################################################################################################################
########################################## COMANDO A EJECUTAR #####################################################
###################################################################################################################
# Informacion sobre el trabajo en Drago
echo ""
echo "#################################################################"
echo "DATOS DE RECURSOS DEL TRABAJO EN DRAGO"
echo "Nombre del Trabajo: $SLURM_JOB_NAME"
echo "Numero de Trabajo: $SLURM_JOB_ID"
echo "Cola de Trabajo: $SLURM_JOB_PARTITION"
echo "Numero de nodos: $SLURM_NNODES"
echo "Numero de Cores (Tareas): $SLURM_NTASKS "
echo "Memoria por Core: $SLURM_MEM_PER_CPU"
echo "Directorio: $SLURM_SUBMIT_DIR"
echo "#################################################################"
echo ""
# numero de cores a utilizar - Debe coincidir con el numeto de cores solicitados
hilos=$SLURM_JOB_CPUS_PER_NODE # Al seleccionar un Nodo podemos utilizar esta variable del Slurm directamente
# Fecha/Hora de inicio del trabajo
echo 'Trabajo iniciado en fecha:'
date
# Localizacion de los ficheros
# Comando para blastear un fichero de proteinas
SqueezeMeta.pl -m coassembly -p test -t $hilos -s test.samples -f Datos
# Fecha/Hora de fin del trabajo
echo 'Trabajo finalizado en fecha:'
date
De cualquier forma podrá descargar scripts desde servicio Git del CSIC,en caso haber disponibles para este software, a continuación: