Vraag:
Hoe kan ik genexpressie berekenen voor een reeks RNA-waarden?
hhoomn
2017-07-08 19:24:13 UTC
view on stackexchange narkive permalink

Ik probeer een genexpressieprofiel voor een organisme te berekenen. Ik heb gennucleotidesequenties van het genoemde organisme opgeslagen in een fasta-bestand en een reeks gepaarde reads opgeslagen in twee afzonderlijke bestanden met hetzelfde fasta-formaat. Nu wil ik de dekking van elk gen berekenen aan de hand van de gegeven waarden. Dat wil zeggen, hoeveel reads beslaan gemiddeld een bepaald segment van de reeks.

Is er een tool voor dit specifieke doel? Ik probeer de fluwelen sequencer te gebruiken, maar ik ben er enkele tegengekomen problemen.

Drie antwoorden:
Devon Ryan
2017-07-08 21:22:44 UTC
view on stackexchange narkive permalink

Het is onduidelijk of uw gekoppelde leesbewerkingen daadwerkelijk in fasta-indeling zijn, ik neem aan dat ze in plaats daarvan in fastq zijn.

De gemakkelijkste tool om te gebruiken is zalm , dat goed omgaat met zaken als multimapping. Als je de kwaliteit van een assembly probeert te beoordelen, raad ik je aan om transrate te bekijken, die een gerelateerde methodologie gebruikt voor het beoordelen van de contig-kwaliteit.

Ja, ze zijn in fasta-formaat, maar ze kunnen gemakkelijk worden omgezet in fastq met uniforme kwaliteit.
Wat is er met de FASTQ's gebeurd? Technisch gezien zou je kunnen converteren naar FASTQ's, maar als de reads om te beginnen geen FASTQ's zijn, is het vaak een rode vlag die andere problemen aangeeft.
Bedankt dat ik Last aligner voor het werk heb gebruikt en de dekkingsgraad handmatig heb berekend (en dat als evenredig met genexpressie beschouwde).
burger
2017-07-09 00:17:51 UTC
view on stackexchange narkive permalink

Naast zalm die al werd genoemd, kun je ook kallisto of RSEM proberen, die ook redelijk populair / respectabel zijn en werken met een transcriptoom FASTA.

gringer
2017-07-09 02:50:32 UTC
view on stackexchange narkive permalink

Het is niet mogelijk om absolute expressie uit RNASeq-reads te berekenen als ze op de gebruikelijke manier worden verwerkt, waarbij een sequencer hetzelfde aantal reads produceert, ongeacht het ingevoerde RNA-bedrag. In het beste geval geeft RNASeq u een indicatie van proportionele expressie binnen een enkele steekproef. Om deze reden is relatieve expressie (dwz die gebruikt wordt door differentiële expressietests) gemakkelijker te bepalen dan absolute expressie.

De beste benadering van absolute expressie is het genereren van een expressie relatief aan de gemiddelde expressie van een reeks huishoudgenen, maar ik denk niet dat er een universele set is waarover is besloten. Genexpressie, zelfs voor gewone huishoudgenen, kan variëren afhankelijk van de omgevingscondities van de cel. GAPDK is bijvoorbeeld betrokken bij activering van immuuncellen.

Zolang de experimentele omstandigheden echter vergelijkbaar zijn en u niet van plan bent te zoeken naar statistische significantie, is de proportionele uitdrukking kan nog steeds kwalitatief inzicht geven in hoe celpopulaties zich gedragen in relatie tot andere populaties. DESeq2 biedt een variantie-stabiliserende transformatiefunctie die variatie voor genen met kleine aantallen minimaliseert, ervan uitgaande dat elk monster ongeveer dezelfde totale expressie heeft. Ik heb gemerkt dat ik betere resultaten / vergelijkingen krijg van deze transformatie wanneer ik een verdere aanpassing uitvoer om rekening te houden met de genlengte (d.w.z. delen door de lengte van het langste transcript voor elk gen). Zie onze Th2-paper, sectie "Read mapping en differentiële expressie-analyse" voor meer informatie. De waarden voor 'transcripties per miljoen' geproduceerd door Kallisto en Salmon bieden vergelijkbare metingen.

Als u daarentegen in staat was om het experimentele ontwerp aan te passen, kan eencellige sequencing (of 'bekende celtelling'-sequencing) worden gebruikt om de absolute expressie te bepalen: gebruik een verrijkt transcript dat proportioneel wordt toegevoegd met het celaantal , zodat de resultaten kunnen worden vergeleken in verhouding tot de uitdrukking voor dat transcript.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...