Vraag:
De effecten van onvolledige bisulfietomzetting op de kaartefficiëntie
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

Deze vraag is ook gepost op Biostars

Ik heb de sequentie bepaald van talloze multiplex pools van BS amplicon-seq-bibliotheken afgeleid van menselijke monsters op een MiSeq in de afgelopen weken. Ik heb trim-galore en Bismark gebruikt voor uitlijning en ik vind dat de mapping-efficiëntie erg laag is voor twee pools (respectievelijk 55% & 30%) die beide een cytosine per basesequentie van ongeveer 10-20% gedurende de hele gelezen in hun fastqc-bestanden.

De hoge C-inhoud die zichtbaar is in de fastqc-bestanden doet me denken dat de slechte kaartefficiëntie te wijten is aan een slechte bisulfietconversie, aangezien dit naar verwachting bijna nul zou zijn als de bisulfietconversie daadwerkelijk heeft plaatsgevonden.

Ik ben nieuw in het veld, dus alle hulp wordt zeer op prijs gesteld.

Het kan goed zijn om vertrouwd te raken met de stappen achter het in kaart brengen van omgezette bisulfiet-uitlezingen. In deze post op [biostars] (https://www.biostars.org/p/107871/) geef ik een korte uitsplitsing van de te nemen stappen als je een kijkje wilt nemen (maar er is natuurlijk veel materiaal beschikbaar ben ermee bezig).
Een antwoord:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

De omzettingsefficiëntie van bisulfiet heeft geen effect op de kaartsnelheid in bismark en vergelijkbare tools. De reden is dat de reads volledig bisulfiet worden geconverteerd in silico voordat ze worden uitgelijnd om vertekening in de mapping te minimaliseren.

Ik zou willen voorstellen dat je speelt met de instellingen die aan bowtie2 worden doorgegeven, zoals het gebruik van lokale uitlijning en het aanpassen van de --score-min optie om meer mismatches toe te staan. U kunt ook een andere aligner proberen, zoals bwameth, die altijd lokaal uitgelijnd is.

Dank je. --lokale vlag in de bowtie2-documenten ziet er veelbelovend uit, ik zal dit proberen als ik op kantoor kom. Zal Bismark alle bowtie2-opties / vlaggen naar bowtie2 parseren (ik vraag het omdat --local niet aanwezig is in bisamark-documenten maar alleen in bowtie2-documenten)? Wat kan ik concluderen over de hoge sequentie van cytosine per basen in de fastqc-bestanden? Ik heb over het algemeen geconstateerd dat dit 0% is in eerdere analyses of 10% aan de uiteinden, op welk punt ik de uiteinden zou bijsnijden.
Ik denk niet dat bismark de `--local` vlag correct zal behandelen, aangezien het verwacht dat reads ofwel volledig uitgelijnd zijn of worden weggegooid, zonder enige zachte clipping.
Als na het uitvoeren van bismark de MBIAS-plots er niet relatief vlak uitzien, kunt u een filterparameter doorgeven aan bismark_methylation_extractor, zodat b.v. u negeert de laatste 10 bp van elke lezing.
@719016: Je hebt misschien gelijk, het is een paar jaar geleden dat ik naar de bismark-code heb gekeken, ik probeer het meestal te vermijden, omdat het zo ongelooflijk traag is en vroeger slechte resultaten opleverde.
Zoals Devon Ryan ook voorstelt, wil je misschien bwameth proberen, wat een eenvoudige wikkel rond bwa-mem is, en de soft-clipped alignments behoudt als ze bestaan. U kunt dan een ander script toepassen om de CpG's van de bam te tellen, bijv. deze: https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
Ik raad over het algemeen [MethylDackel] (https://github.com/dpryan79/MethylDackel) aan voor methyleringsextractie en QC, maar ik ben bevooroordeeld: P


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...