Hi everyone,
after alignment to v4 region following the steps of SOP I’ve applied the filter.seqs considering vertical T and trump=. and then unique.seqs once again.
However, the resulting fasta file still remain gaps (-) in there as showed an example below. Probably it is affecting my analysis and the use of the final fasta in picrust, since I received a error message talking about poorly alignment in the fasta file (resulted from many gaps).
How can I solve this?
(example of file “luan.trim.contigs.good.unique.good.filter.unique.fasta”)
>UA231200064738283
T--AC--GG-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GC-AC-------G-CA-G-G-C-G---G--T-CT-G-T-T---AA--G-T-C-A-------G-A-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-T-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------T--GA-A-A---C------T-G-G--CA--G-G-C-----------T-A-G-A-G-T--C----T-TG----TA-G-A----GTG-G-G---G--T---------AG--A--ATT--------C-C-A-G-GT--GT-A-G-CG-GT--G-A-A-A--TG-C-GT-AG--AG-A-TC-T-G-G-A----G-G-A-AT-A-CC----GG--T--G--GC-GAA-G--G-C--G--G--C-C-C-C--CTT---G--AC-A-A----------------------A-G---A-C-T--GA--CG--C--T-C--A-GG--T-G-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA2312000645130002
T--AC--GT-AG-GGT----GCG-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GT-GC-------G-CA-G-G-C-G---G--T-TG-T-G-T---AA--G-A-C-A-------G-G-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-C-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------C--GA-A-A---C------T-G-G--CA--G-G-C-----------T-A-G-A-G-T--C----T-TG----TA-G-A----G-G-G-G---GG-T---------AG--A--ATT--------C-C-C-A-GT--GT-A-G-CG-GT--G-A-A-A--TG-C-GT-AG--AG-A-TT-G-G-G-A----A-G-A-AC-A-TC----GG--T--G--GC-GAAAG--C-G--T--G--C-T-A-C---TG---G--GC-T-G----------------------T-A---T-C-T--GA--CA--C--T-C--A-GG--G-A-CG-A--AA-G-C---T-AG--GG-G--AG-C-G-AA-AG--GG
>UA231200064759023
T--AC--GT-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GT-GC-------GTCA-G-G-C-G---G--T-AA-T-G-T---AA--G-A-C-A-------G-T-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-C-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--C---------T--GT-G-A---C------T-G-C--AT--T-G-C-----------T-G-G-A-G-T--A----C-GG----CA-G-A----G-G-G-G---GA-T---------GG--A--ATT--------C-C-G-C-GT--GT-A-G-CA-GT--G-A-A-A--TG-C-GT-AG--AT-A-TG-C-G-G-A----G-G-A-AC-A-CC----GA--T--G--GC-GAA-G--G-C--A--A--T-C-C-C--CTG---G--GC-C-T----------------------G-T---A-C-T--GA--CG--C--T-C--A-TG--C-A-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA231200064891860
T--AC--GG-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GC-AC-------G-CA-G-G-C-G---G--T-CT-G-T-C---AA--G-T-C-G-------G-A-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-C-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------C--GA-A-A---C------T-G-G--CA--G-G-C-----------T-T-G-A-G-T--C----T-TG----TA-G-A----G-G-G-G---GG-T---------AG--A--ATT--------C-C-A-G-GT--GT-A-G-CG-GT--G-A-A-A--TG-C-GT-AG--AG-A-TC-T-G-G-A----G-G-A-AT-A-CC----GG--T--G--GC-GAA-G--G-C--G--G--C-C-C-C--CTG---G--AC-A-A----------------------A-G---A-C-T--GA--CG--C--T-C--A-GG--T-G-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA2312000644152077
G--AC--GG-GG-GGG----GCA-A-G--T-G-T-T--CT-T-CGG-AA--TG-A--C-T--GG-GC--GT--A---AA-GG-GC-AC-------G-TA-G-G-C-G---G--T-GA-A-T-C---GG--G-T-T-G-------A-A-A--G--TG--A-AA-G---T-C-GC-C-A--------AA-A-AG--------T-G-G-C-G-G-A--A------T-G--C-T---C--T---------C--GA-A-A---C------C-A-A--TT--C-A-C-----------T-T-G-A-G-T--G----G-GA----CA-G-G----G-G-A-G---AG-T---------GG--A--ATT--------T-C-G-T-GT--GT-A-G-GG-GT--G-A-A-A--TC-C-AG-AA--AT-C-TA-C-G-A-A----G-G-A-AC-G-CC----AA--A--A--GC-GAA-G--G-C--A--G--C-T-C-T--CTG---G--GT-C-C----------------------C-T---A-C-C--GA--CG--C--T-G--A-GG--T-G-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA2312000644142327
T--AC--GG-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GC-AC-------G-CA-G-G-C-G---G--T-CT-G-T-C---AA--G-T-C-G-------G-A-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-C-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------C--GA-A-A---C------T-G-G--CA--G-G-C-----------T-A-G-A-G-T--C----T-TG----TA-G-A----G-G-G-G---GG-T---------AG--A--ATT--------C-C-A-G-GT--GT-A-G-CA-GT--G-A-A-A--TG-C-GT-AG--AG-A-TC-T-G-G-A----G-G-A-AT-A-CC----GG--T--G--GC-GAA-G--G-C--G--G--C-C-C-C--CTG---G--AC-A-A----------------------A-G---A-C-T--GA--CG--C--T-C--A-TG--C-A-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA231200064744279
T--AC--GG-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GC-AC-------G-CA-G-G-C-G---G--T-CT-G-T-C---AA--G-T-C-G-------G-A-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-C-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------C--GA-A-A---C------T-G-G--CA--G-G-C-----------T-A-G-A-G-T--C----T-TG----TA-G-A----G-G-G-G---GG-T---------AG--A--ATT--------C-C-A-G-GT--GT-A-G-CG-GT--G-A-A-A--TG-C-GT-AG--AG-A-TC-T-G-G-A----G-G-A-AT-A-CC----GG--T--G--GC-GAA-G--G-C--G--G--C-C-C-C--CTG---G--AC-A-A----------------------A-G---A-C-T--GA--CG--C--T-C--A-GG--T-G-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG
>UA231200064353574
T--AC--GG-AG-GGT----GCA-A-G--C-G-T-T--AA-T-CGG-AA--TT-A--C-T--GG-GC--GT--A---AA-GC-GC-AC-------G-CA-G-G-C-G---G--T-CT-G-T-T---AA--G-T-C-A-------G-A-T--G--TG--A-AA-TC--C-C-CG-G-G--------CT-T-AA--------C-C-T-G-G-G-A--A-C----T-G--C-A---T--T---------T--GA-A-A---C------T-G-G--CA--G-G-C-----------T-T-G-A-G-T--C----T-CG----TA-G-A----G-G-G-G---GG-T---------AG--A--ATT--------C-C-A-G-GT--GT-A-G-CG-GT--G-A-A-A--TG-C-GT-AG--AG-A-TC-T-G-G-A----G-G-A-AT-A-CC----GG--T--G--GC-GAA-G--G-C--G--G--C-C-C-C--CTG---G--AC-G-A----------------------A-G---A-C-T--GA--CG--C--T-C--A-GG--T-G-CG-A--AA-G-C---G-TG--GG-G--AG-C-A-AA-CA--GG