Voor het tellen van reads gebruik ik mpileup, bijv. samtools mpileup --reference hg38.fa -r Chr10: 18000-45500 input.bam
, wat een basisresolutie dekking geeft voor een BAM-bestand.
Ik heb geschreven mijn eigen script om mpileup-uitvoer te verwerken en het begrijpelijker te maken. Standaard rapporteert het leesdekking als een deel van de totale dekking, maar dit kan worden gewijzigd door het -counts
opdrachtregelargument te gebruiken:
$ samtools mpileup -r tig00018708_tig00000379 : 210665-240664: 2107-2130 --referentie trimMmerged_tig00018708_other.fasta local_Sampled_50M_vs_trimMmerged_tig00018708_other.bam | /bioinf/scripts/readstomper.pl -counts
[mpileup] 1 samples in 1 invoerbestanden<mpileup> Stel de maximale diepte per bestand in op 8000 Montage, Positie, Dekking, ref, cR, pR, A, C, G, T, d, i, InsModetig00018708_tig00000379: 210665-240664,2107,10, C, 10,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2108,11, G, 11,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2109,11, T, 11,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2110, 11, T, 11,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2111,12, G, 12,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664, 2112,14, G, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2113,13, C, 13,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665- 240664,2114,13, G, 13,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2115,13, C, 2,0.15,0,0,0,11,0,0tig00018708_tig00000379: 210665-240664,2116,15, T, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2117,15, G, 14,1.00,0,0,0,0,0, 0tig00018708_tig00000379: 210665-240664,2118,18, A, 1 7,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2119,19, T, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2120,19, C, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2121,18, A, 7,0.41,0,0,10,0,0,0tig00018708_tig00000379: 210665-240664,2122, 18, G, 18,1.00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2123,18, T, 18,1.00,0,0,0,0,0,0,0
tig00018708_tig00000379: 210665-240664,2124,18, C, 18,1.00,0,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2125,18, C, 9,0.50,0,0,0,9, 0,0tig00018708_tig00000379: 210665-240664,2126,18, C, 14,0.78,2,0,1,1,0,0tig00018708_tig00000379: 210665-240664,2127,18, C, 18,1.00,0,0,0, 0,0,0tig00018708_tig00000379: 210665-240664,2128,18, T, 15,0.83,0,0,3,0,0,0tig00018708_tig00000379: 210665-240664,2129,17, A, 13,0.76,0,0, 4,0,0,0tig00018708_tig00000379: 210665-240664,2130,16, A, 9,0.56,0,6,1,0,0,0
Merk op dat alleen niet-referentie -dekking wordt gerapporteerd in de A / C / G / T / d / i-kolommen. Ik heb gemerkt dat dit het gemakkelijker maakt voor latere gegevensanalyse, maar uw aantal kilometers kan variëren.