Problème sur la nouvelle base de référence
Il y a un soucis avec la nouvelle base de référence compilée pour le rapid run.
Mes assignations reviennent avec 0 MOTUs assignés à l'espèce et que des trucs improbables.
J'ai regardé un peu d'où pourrait venir la source du problème, je prend un exemple d'un poisson qui est séquencé dans la base de référence et présent sur mon jeu de données:
- Nom: Lutjanus erythropterus
- Séquence (teleo): ccccaagcttataacactaagtacctaaaaccttaaaactgcaaaggggaggcaagtcgtaa
Si je cherche sur l'ancienne base:
grep 'Lutjanus erythropterus' /media/superdisk/edna/donnees/reference_database/reference_database_teleo/v_embl_std_clean.fasta -A2
>KP939271 family_name=Lutjanidae; species_name=Lutjanus erythropterus; family=30850; reverse_match=CTTCCGGTACACTTACCATG; taxid=211835; rank=species; forward_error=0; forward_tm=60.26; genus_name=Lutjanus; seq_length_ori=16509; forward_match=ACACCGCCCGTCACTCT; reverse_tm=54.79; genus=40493; reverse_error=0; species=211835; strand=D; Lutjanus erythropterus mitochondrion, complete genome
ccccaagcttataacactaagtacctaaaaccttaaaactgcaaaggggaggcaagtcgt
aa
Maintenant je fais la même chose sur la nouvelle base:
grep 'Lutjanus erythropterus' /media/superdisk/edna/donnees/reference_database/ref141/reference_database_teleo/v_embl_std_clean.fasta -A2
>KP939271 family_name=Lutjanidae; species_name=Lutjanus erythropterus; family=30850; reverse_match=ACACCGCCCGTCACTCT; taxid=211835; rank=species; forward_error=0; forward_tm=50.96; genus_name=Lutjanus; seq_length_ori=16509; forward_match=CTTCCGGTACACTTACCATG; reverse_tm=nan; genus=40493; reverse_error=0; species=211835; strand=R; Lutjanus erythropterus mitochondrion, complete genome
ttacgacttgcctcccctttgcagttttaaggttttaggtacttagtgttataagcttgg
gg
--
L'espèce existe, seulement sa séquence est totalement différente, ce qui n'est pas normal avec le même primer.
On remarque la différence suivante dans les header:
strand=R
au lieu de strand=D
.
En réalité, toutes les séquences sont à l'envers. Ce sont les reverse complement de ce qu'on est censé obtenir.
Tu as une idée de pourquoi on obtient ce genre de choses?