Vraag:
Bevestig het slagen of mislukken van RNA-Seq-normalisatie
Scott Gigante
2017-05-18 05:28:24 UTC
view on stackexchange narkive permalink

Ik werk met een set (bulk) RNA-Seq-gegevens die zijn verzameld over meerdere runs, die op verschillende tijdstippen van het jaar worden uitgevoerd. Ik heb mijn gegevens genormaliseerd met bibliotheekgrootte / kwantiel / RUV-normalisatie en wil graag (kwantitatief en / of kwalitatief) controleren of normalisatie erin is geslaagd de batch-effecten te verwijderen.

Het is belangrijk op te merken dat met "normalisatie is geslaagd", ik eenvoudig bedoel dat ongewenste variatie is verwijderd - verdere analyse is vereist om er zeker van te zijn dat biologische variatie niet is verwijderd. Wat zijn enkele plots / statistische tests / softwarepakketten die een eerste stap QC bieden voor normalisatie?

Twee antwoorden:
#1
+17
SmallChess
2017-05-18 05:49:44 UTC
view on stackexchange narkive permalink

U moet boxplots en PCA-plot gebruiken. Laten we eens kijken naar de RUV-paper:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4404308/

Voor normalisatie en na UQ-normalisatie :

enter image description here

Bibliotheken doen niet clusteren zoals verwacht volgens behandeling. ... voor UQ-genormaliseerde tellingen. UQ-normalisatie leidt niet tot een betere clustering van de samples ...

Vóór normalisatie zien de medianen in de box-plot er duidelijk heel anders uit tussen replicaten.

Na UQ-normalisatie, de medianen kijken dichterbij, maar Trt.11 ziet eruit als een uitbijter. Bovendien zijn de behandelingen niet geclusterd op de PCA-plot. Omdat het replica's zijn, zou je willen dat ze dichtbij de plot staan.

Na RUV-normalisatie

enter image description here

... RUVg verkleint de expressiemaatstaven voor Bibliotheek 11 naar de mediaan tussen bibliotheken, wat duidt op robuustheid tegen uitschieters. ... Bibliotheken clusteren zoals verwacht door behandeling. ...

De RUV heeft de distributie robuuster gemaakt en de monsters dichter bij de PCA-plot. Het is echter nog steeds niet perfect, aangezien een van de behandelingen niet in de buurt komt van de andere twee op de eerste pc.

De vignetten voor Bioconductor RUVSeq beschrijven de twee functies: plotRLE en plotPCA .

Ik zou kunnen wijzen op het onderscheid tussen een RLE-plot (hier weergegeven) en een gewone boxplot (een onderscheid gemaakt op pagina 3 van de preprint van april 2017 over RLE-plots: visualisatie van ongewenste variatie in hoogdimensionale gegevens op https://arxiv.org/ pdf / 1704.03590.pdf). Anders een uitstekend antwoord, maar belangrijk om uit te leggen wat RLE betekent.
#2
+8
Daniel Standage
2017-05-23 00:07:50 UTC
view on stackexchange narkive permalink

Visuele inspectie met histogrammen, boxplots of een andere distributievisualisatie is de juiste keuze. Vóór normalisatie kunnen uw overvloed er ongeveer zo uitzien. Pre-norm

Na normalisatie zouden ze er ongeveer zo uit moeten zien. Post-norm

Zie deze blogpost voor voorbeeldcode.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...