Vraag:
Toon aanwezigheid van bekende mutatie in RNA-seq-gegevens
Peter
2017-12-18 22:31:36 UTC
view on stackexchange narkive permalink

We hebben RNA-seq fastq-gegevens van controle (WT) -patiënten en een patiënt met een puntmutatie op een bekende locatie in één gen. Ik zou de reads willen ophalen die zijn uitgelijnd met dat gen en de aanwezigheid van de mutatie aantonen .

Ik kan 2 strategieën bedenken:

A)

Afstemming en visualisatie, gebaseerd op GATK:

  1. STAR 2-pass uitvoeren

  2. Interessante uitlijningen extraheren, bijvoorbeeld:

    samtools view input.bam "Chr10: 18000-45500" > output.sam

  3. Visualiseer:

Hoe kan ik de reads tellen die mutatie versus wildtype laten zien?


B)

De tweede benadering zou eenvoudigweg zoeken naar de toewijzing van telnummers (bijv. Zalm) aan de transcript-ID ('s) die overeenkomen met mutatie en WT, op basis van dit SE-antwoord.

Is er een betere manier om dit te doen?

Drie antwoorden:
Matt Bashton
2018-08-08 00:30:04 UTC
view on stackexchange narkive permalink

Als je maar één gen hebt en je hoeft dit maar één keer te doen, dan is de eenvoudigst mogelijke workflow om het voedsel te genereren met STAR (optimaal met de two pass-methode) en de twee resulterende .bam code te openen. > bestanden in IGV, moet de dekkingskolom bij de halte boven uw uitlijningsspoor duidelijk de tellingen van referentie- en niet-referentie ondersteunende reads weergeven. De IGV documentatie toont een schermafdruk, de pop-updekkingsindicator en het allelspecifieke aantal lezingen.

gringer
2017-12-19 01:26:19 UTC
view on stackexchange narkive permalink

Voor het tellen van reads gebruik ik mpileup, bijv. samtools mpileup --reference hg38.fa -r Chr10: 18000-45500 input.bam , wat een basisresolutie dekking geeft voor een BAM-bestand.

Ik heb geschreven mijn eigen script om mpileup-uitvoer te verwerken en het begrijpelijker te maken. Standaard rapporteert het leesdekking als een deel van de totale dekking, maar dit kan worden gewijzigd door het -counts opdrachtregelargument te gebruiken:

$ samtools mpileup -r tig00018708_tig00000379 : 210665-240664: 2107-2130 --referentie trimMmerged_tig00018708_other.fasta local_Sampled_50M_vs_trimMmerged_tig00018708_other.bam | /bioinf/scripts/readstomper.pl -counts

  [mpileup] 1 samples in 1 invoerbestanden<mpileup> Stel de maximale diepte per bestand in op 8000 Montage, Positie, Dekking, ref, cR, pR, A, C, G, T, d, i, InsModetig00018708_tig00000379: 210665-240664,2107,10, C, 10,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2108,11, G, 11,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2109,11, T, 11,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2110, 11, T, 11,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2111,12, G, 12,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664, 2112,14, G, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2113,13, C, 13,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665- 240664,2114,13, G, 13,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2115,13, ​​C, 2,0.15,0,0,0,11,0,0tig00018708_tig00000379: 210665-240664,2116,15, T, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2117,15, G, 14,1.00,0,0,0,0,0, 0tig00018708_tig00000379: 210665-240664,2118,18, A, 1 7,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2119,19, T, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2120,19, C, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2121,18, A, 7,0.41,0,0,10,0,0,0tig00018708_tig00000379: 210665-240664,2122, 18, G, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2123,18, T, 18,1.00,0,0,0,0,0,0,0
tig00018708_tig00000379: 210665-240664,2124,18, C, 18,1.00,0,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2125,18, C, 9,0.50,0,0,0,9, 0,0tig00018708_tig00000379: 210665-240664,2126,18, C, 14,0.78,2,0,1,1,0,0tig00018708_tig00000379: 210665-240664,2127,18, C, 18,1.00,0,0,0, 0,0,0tig00018708_tig00000379: 210665-240664,2128,18, T, 15,0.83,0,0,3,0,0,0tig00018708_tig00000379: 210665-240664,2129,17, A, 13,0.76,0,0, 4,0,0,0tig00018708_tig00000379: 210665-240664,2130,16, A, 9,0.56,0,6,1,0,0,0  

Merk op dat alleen niet-referentie -dekking wordt gerapporteerd in de A / C / G / T / d / i-kolommen. Ik heb gemerkt dat dit het gemakkelijker maakt voor latere gegevensanalyse, maar uw aantal kilometers kan variëren.

Peter
2019-09-08 23:29:01 UTC
view on stackexchange narkive permalink

SCmut is een methode om mutaties op celniveau te detecteren uit eencellige RNA-sequentiebepaling, gepubliceerd door Vu et al. (2019)

https://github.com/nghiavtr/SCmut



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...