Zijn er voorgestelde parameters om ONT-reads af te stemmen op het referentiegenoom met behulp van STAR-long? Voorlopig heb ik de parameters gebruikt die hier worden voorgesteld, maar ik merkte een vreemd gedrag op.
Ik heb RNA-reads ( D. melanogaster ) van R7
en R9
stroomcellen, afzonderlijk. Ik heb er alleen voor gekozen om 2D
leest in de categorie pass
te analyseren.
Ik heb respectievelijk 113249 reads voor R7
en 40318 reads voor R9
. Ik heb die leesbewerkingen uitgelijnd en krijg (slechts!) 150 uniek toegewezen leesbewerkingen voor R7
-gegevens en 8017 uniek toegewezen leesbewerkingen voor R9
-gegevens. Ik heb geprobeerd dezelfde opdracht opnieuw uit te voeren op een andere server met een nieuwe compilatie, maar het uitvoerbestand is consistent met deze 150 keer gelezen.
Als ik hetzelfde echter uitlijn met GMAP, krijg ik 78016 uniek toegewezen leesbewerkingen voor R7
en 33523 uniek toegewezen leesbewerkingen voor R9
, dus ik vermoed dat er iets mis is gegaan tijdens de uitlijningsrun.
Ik ben me ervan bewust dat de twee mappers zich heel verschillend gedragen, STAR-long is preciezer en geeft er de voorkeur aan mappings van minder reads te rapporteren maar op betere loci, en GMAP is over het algemeen minder nauwkeurig en probeert het meeste van de leest maar op niet-zo-goede loci.
Ik vroeg me af of sommigen van jullie hier ervaring mee hadden en me de beste parameters konden voorstellen voor RNA-reads van ONT?