Vraag:
Normalisatiemethoden met RNA-Seq ERCC-piek in?
SmallChess
2017-05-17 10:24:25 UTC
view on stackexchange narkive permalink

ERCC spike-in is een set synthetische controles die zijn ontwikkeld voor RNA-Seq. Ik ben geïnteresseerd om het te gebruiken om mijn RNA-Seq-samples te normaliseren. In het bijzonder zou ik de spike-ins willen gebruiken om technische vooringenomenheid te verwijderen en elke variatie die geen deel zou moeten uitmaken van mijn analyse.

De site geeft geen details over hoe ik dat kan doen .

V: Wat zijn de mogelijke normalisatiestrategieën? Kun je ze kort beschrijven?

Bent u geïnteresseerd in bulk of eencellige RNA-seq? De waarde van spike-ins is enorm verschillend, afhankelijk daarvan
Twee antwoorden:
#1
+9
Scott Gigante
2017-05-17 10:43:41 UTC
view on stackexchange narkive permalink

U kunt overwegen RUVSeq te gebruiken. Hier is een fragment uit de Nature Biotechnology-publicatie uit 2013:

We evalueren de prestaties van de spike-in-controles van het External RNA Control Consortium (ERCC) en onderzoeken de mogelijkheid van ze direct gebruiken voor normalisatie. We laten zien dat de spike-ins niet betrouwbaar genoeg zijn om te worden gebruikt in standaard global-scaling of op regressie gebaseerde normalisatieprocedures. We stellen een normalisatiestrategie voor, genaamd remove ongewenste variatie (RUV), die corrigeert voor hinderlijke technische effecten door factoranalyse uit te voeren op geschikte sets van controlegenen (bijv. ERCC-spike-ins) of monsters (bijv. Replicatiebibliotheken).

RUVSeq past in wezen een gegeneraliseerd lineair model (GLM) toe op de expressiegegevens, waarbij uw expressiematrix $ Y $ een $ m $ bij $ n $ matrix is, waarbij $ m $ het aantal steekproeven is en $ n $ het aantal genen. Het model komt neer op

$ Y = X * \ beta + Z * \ gamma + W * \ alpha + \ epsilon $

waar $ X $ de voorwaarden van belang beschrijft ( bijv. behandeling vs. controle), $ Z $ beschrijft waargenomen covariaten (bijv. geslacht) en $ W $ beschrijft niet-waargenomen covariaten (bijv. batch, temperatuur, laboratorium). $ \ beta $, $ \ gamma $ en $ \ alpha $ zijn parametermatrices die de bijdrage van $ X $, $ Z $ en $ W $ registreren, en $ \ epsilon $ is willekeurige ruis. Voor een subset van zorgvuldig geselecteerde genen (bijv. ERCC-spike-ins, huishoudgenen of technische replicaten) kunnen we aannemen dat $ X $ en $ Z $ nul zijn, en $ W $ vinden - de "ongewenste variatie" in uw steekproef.

#2
+4
gringer
2017-08-02 03:16:10 UTC
view on stackexchange narkive permalink

We hebben ERCC-spike-ins toegevoegd aan al onze RNASeq-gegevens, voor het geval andere mensen het in de toekomst nuttig zouden kunnen vinden. Ik heb het echter nooit in mijn eigen analyses gebruikt, omdat ik geen redelijke manier kan bedenken waarop het zou kunnen worden gebruikt.

De typische aanbeveling voor ERCC is om het toe te voegen in verhouding tot de hoeveelheid ingevoerd RNA , maar dat veronderstelt dat het totaal aantal cel-RNA-tellingen vergelijkbaar is voor verschillende cellen (wat aantoonbaar onjuist is door te kijken naar de RNASeq-resultaten van één cel).

Ik moet nog een situatie bedenken waarin ERCC betere resultaten dan een "huishoudelijke" genenset die is bemonsterd uit de originele waarden.

Waarom zou u ERCC inzetten als u er geen gebruik van heeft?
We doen hetzelfde, de benodigde sequencing-diepte is erg klein, dus het is goedkoop en "better safe than sorry".
We hebben geprobeerd dingen toe te voegen die zouden betekenen dat we de runs in de toekomst niet opnieuw hoefden te doen.
Een mogelijk voordeel is dat als je extreme vooroordelen lijkt te hebben in bepaalde samples (bijv. Een ENORM% van de reads gaat naar ERCC), je weet dat er iets mis is gegaan met de nucleïnezuren (bijv. Slechte extractie, te lage input, enz ...).
Ja, ik denk dat ERCC's een redelijke positieve controle zijn voor de monstervoorbereiding. Die problemen met het voorbereiden van monsters komen ook op andere manieren naar voren (bijv. Hoog aandeel ribosomale mapping, lage mapping rate, GC-verschil, aantal transcripten uitgedrukt boven X-niveau, PCA).


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...