Erreur lancement clustering
Salut,
J'ai encore un bug avec la pipeline..
Je relance tout Malpelo-fakarava sur la pipeline de snakemake rapid run car j'ai rajouté les contrôles PCR qui avaient été omis avant, et qu'on regroupe toutes les données au propre pour l'analyse globale.
Je ne comprend pas pourquoi l'analyse se stoppe au moment du clustering (etape 05_)
Voici le log du nohop (visible ici /media/superdisk/edna/working/malpelo_fakarava/snakemake_rapidrun_swarm
)
/usr/local/lib/python3.6/dist-packages/snakemake-5.6.0+8.g89bc383f-py3.6.egg/snakemake/workflow.py:30: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
from snakemake.utils import update_config
Building DAG of jobs...
MissingInputException in line 40 of /media/superdisk/edna/working/malpelo_fakarava/snakemake_rapidrun_swarm/05_clustering/Snakefile:
Missing input files for rule all:
02_otu_table/Malpelo/mamm/all.otu.csv
02_otu_table/Other/teleo/all.otu.csv
02_otu_table/Fakarava/vert/all.otu.csv
02_otu_table/Malpelo/chond/all.otu.csv
02_otu_table/Fakarava/teleo/all.otu.csv
02_otu_table/Fakarava/mamm/all.otu.csv
02_otu_table/Malpelo/teleo/all.otu.csv
02_otu_table/Fakarava/chond/all.otu.csv
02_otu_table/Malpelo/vert/all.otu.csv
projet marker projMark
0 Fakarava chond Fakarava/chond
1 Fakarava chond Fakarava/chond
2 Fakarava chond Fakarava/chond
3 Fakarava chond Fakarava/chond
4 Fakarava chond Fakarava/chond
... ... ... ...
1790 Malpelo vert Malpelo/vert
1791 Malpelo vert Malpelo/vert
1792 Malpelo vert Malpelo/vert
1793 Malpelo vert Malpelo/vert
1794 Malpelo vert Malpelo/vert
[1795 rows x 3 columns]
/usr/local/lib/python3.6/dist-packages/snakemake-5.6.0+8.g89bc383f-py3.6.egg/snakemake/workflow.py:30: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
from snakemake.utils import update_config
Building DAG of jobs...
MissingInputException in line 7 of /media/superdisk/edna/working/malpelo_fakarava/snakemake_rapidrun_swarm/00_rules/assignment.smk:
Missing input files for rule taxonomic_assign:
../05_clustering/03_otu_fasta/Fakarava/chond/all.otu.fasta
projet marker projMark
0 Fakarava chond Fakarava/chond
1 Fakarava chond Fakarava/chond
2 Fakarava chond Fakarava/chond
3 Fakarava chond Fakarava/chond
4 Fakarava chond Fakarava/chond
... ... ... ...
1790 Malpelo vert Malpelo/vert
1791 Malpelo vert Malpelo/vert
1792 Malpelo vert Malpelo/vert
1793 Malpelo vert Malpelo/vert
1794 Malpelo vert Malpelo/vert
[1795 rows x 3 columns]
Error: Snakefile "Snakefile" not found.
A priori il y a des fichiers manquants, mais c'est normal car ils doivent être créer après d'après les rules définies.
J'ai l'impression qu'il ne lance pas les premières règles du clustering, d'où les fichiers qui apparaissent comme manquants, mais je ne comprend pas pourquoi.
Tout s'est très bien passé jusque là (étape de cat en 04_).
Merci