Vraag:
Afstemming gebaseerd versus referentievrij (transcriptoomanalyse)?
SmallChess
2017-05-17 10:19:49 UTC
view on stackexchange narkive permalink

Ik wil me concentreren op transcriptoomanalyse. We weten dat het mogelijk is om RNA-Seq-experimenten te analyseren op basis van uitlijning of k-mers.

Mogelijke uitlijningsworkflow:

Mogelijke referentievrije workflow:

  • Kwantificeer sequentie leest met Kallisto referentievrije index

Beide strategieën genereren genexpressietabel.

V: Wat zijn voor- en nadelen voor elk van de benaderingen? Kunt u een richtlijn geven?

Referentievrije kwantificering bestaat niet echt (en Kallisto is het ook niet).
Hier is een project dat probeert tools te bouwen voor sequentiegegevens met hoge doorvoer zonder referentie: https://colibread.inria.fr/project/
Twee antwoorden:
#1
+11
Sarah Carl
2017-05-17 12:58:47 UTC
view on stackexchange narkive permalink

Allereerst zou ik willen benadrukken dat "uitlijningsvrije" kwantificeringsinstrumenten zoals Salmon en Kallisto niet referentievrij zijn. Het fundamentele verschil tussen hen en meer traditionele aligners is dat ze geen specifieke positie (in een genoom of transcriptoom) rapporteren waarnaar een kaart wordt gelezen. Hun algemene doel is echter nog steeds om de expressieniveaus (of verschillen) van een bekende set transcripten te kwantificeren; daarom hebben ze een referentie nodig (die willekeurig kan worden gedefinieerd).

Het belangrijkste criterium om te beslissen welke benadering te gebruiken (en dit geldt voor bijna alles in genomics) is precies welke vraag je zou willen antwoord. Als u voornamelijk geïnteresseerd bent in het kwantificeren en vergelijken van expressie van volwassen mRNA van bekende transcripten, dan is een op transcriptoom gebaseerde uitlijning wellicht het snelst en het beste. Het is echter mogelijk dat u potentieel interessante kenmerken mist buiten die bekende transcripten, zoals nieuwe isovormen, niet-coderende RNA's of informatie over pre-mRNA-niveaus, die vaak kunnen worden afgeleid uit intronische uitlezingen (zie de EISA methode).

Dit artikel bevat ook een aantal goede overwegingen over welke tools het beste werken, afhankelijk van de vraag die u wilt beantwoorden.

Tot slot nog een snelle en flexibele aligner (die kan worden gebruikt met of zonder referentietranscriptoom) is STAR.

#2
+7
H. Gourlé
2017-05-17 11:29:37 UTC
view on stackexchange narkive permalink

Ik zou niet zeggen dat Kallisto (of Salmon) referentievrij is. Ze gebruiken een transcriptoom als referentie en een concept genaamd pseudo-alignment dat het proces van het toewijzen van je reads aan een transcript aanzienlijk versnelt.

Dat gezegd hebbende, beide benaderingen van (i) mapping tegen een referentiegenoom (wat u alignment workflow noemde) en (ii) mapping tegen een referentietranscriptoom zal verschillende doelen dienen

Transcriptoom mapping met pseudoalignent wordt de voorkeursmethode voor gen / transcriptiekwantificatie en differentiële expressieanalyse. Het nadeel is dat u zich alleen concentreert op bekende transcripties.

Twee typische workflows zijn:

  • Kallisto gevolgd door speurder
  • Salmon, gevolgd door tximport en DESeq2 / EdgeR

Genome mapping is bijvoorbeeld handig voor het ontdekken van nieuwe isovormen. Je zou TopHat niet meer moeten gebruiken omdat het is stopgezet door de auteur.

Een typische workflow zou zijn:

  • Hisat2 (uitlijning)
  • StringTie (transcriptiesamenstelling en schatting van overvloed)
  • Ballgown (differentiële uitdrukking)
Het is alleen vermeldenswaard (naast dit zeer nuttige antwoord) dat Salmon ook kan worden gebruikt met speurder door middel van het pakket [wasabi] (https://github.com/COMBINE-lab/wasabi).


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...