Vraag:
Worden soft-clipped bases gebruikt voor het aanroepen van varianten in samtools + bcftools?
mattm
2017-05-19 23:50:05 UTC
view on stackexchange narkive permalink

Als er soft clipped basenparen zijn gespecificeerd in de CIGAR-string voor het lezen in een SAM / BAM-bestand, zullen deze worden gebruikt voor het aanroepen van varianten in een samtools + bcftools workflow?

De GATK HaplotypeCaller heeft bijvoorbeeld een expliciete optie --dontUseSoftClippedBases voor het al dan niet gebruiken van soft clipped bases. De samtools-documentatie vermeldt geen afgekapte bases.

Een antwoord:
#1
+12
Devon Ryan
2017-05-20 00:19:13 UTC
view on stackexchange narkive permalink

Nee, samtools (en dus bcftools) maakt geen gebruik van soft-clipped bases. U kunt dit snel bevestigen door ofwel samtools depth of samtools mpileup te gebruiken om naar een gebied te kijken met een soft-clipped alignment. U zult opmerken dat het soft-clipped-gebied niet wordt gebruikt in de depth / pileup (beide tools gebruiken dezelfde onderliggende code, dus het maakt niet uit welke u gebruikt). Als je nieuwsgierig bent, negeert samtools soft-clipped bases omdat het gebaseerd is op het maken van een stapel per-base uitlijningen die elke positie bedekken. In het BAM-formaat worden uitlijningen gesorteerd en toegewezen aan opslaglocaties op basis van hun start- / eindposities, waarbij soft-clipping niet is inbegrepen. Bijgevolg, wanneer samtools de pileup maakt, zal het niet eens de uitlijningen zien die een gegeven basis zouden overlappen als soft-clipped bases waren opgenomen.

Dit roept dan de vraag op wat GATK's HaplotypeCaller doet anders. Daar worden regio's in het genoom in wezen geassembleerd in een kleine de Bruijn-grafiek, waardoor soft-geknipte bases rond indels kunnen worden opgelost, aangezien de grafiek een klein eindje voorbij elke kant van indels zou beginnen / eindigen. Dit is ook de reden waarom je niet opnieuw hoeft uit te lijnen met de HaplotypeCaller (dit was nodig in de oude UnifiedGenotyper).

Bewerken : Voor meer details over de HaplotypeCaller, zie deze leuke pagina op de website van GATK, die veel gedetailleerder ingaat dan hier.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...