Vraag:
Classificatie van monsters op basis van genexpressie van merkers
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Ik heb een paar sets markergenen die ik RNA-seq-monsters kan classificeren met behulp van semi-supervised clustering. Ik zou het proces willen automatiseren, maar ik heb moeite om het ideale algoritme te vinden dat een soort score kan genereren voor een set markergen uit een bepaald monster.

Ik neem aan dat dit in veel groepen een standaardanalyse is, maar ik weet niet zeker welke methode (s) in de praktijk goede resultaten opleveren.

Onlangs was er een soortgelijke vraag over Biostars die geen antwoorden opleverde: https://www.biostars.org/p/239228/
Ik ben verrast. Het lijkt zo'n belangrijk probleem. Vooral nu scRNA-seq aan populariteit wint.
Aangezien u scRNA-seq-gegevens noemde, bent u wellicht geïnteresseerd in [Buettner * & al. *] (Https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): " Computationele analyse van cel-tot-cel heterogeniteit in eencellige RNA-sequentiegegevens onthult verborgen subpopulaties van cellen ”. Het lost uw probleem niet helemaal op, maar het toont enkele van de problemen die verband houden met het identificeren van celpopulaties in het bijzonder in scRNA-seq, die grotendeels worden gladgestreken in bulk RNA-seq.
Een antwoord:
#1
+7
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Ik zou overwegen om handtekeningen van genexpressie te gebruiken om monsters te classificeren (vooral kankersubtypen, maar dezelfde principes zijn van toepassing op andere problemen van dit type) als een van de klassieke problemen van bio-informatica. Er is heel wat werk verzet aan methoden om genensets af te leiden die goede classificatieprestaties bieden. Dit verschilt enigszins van uw probleem, aangezien u al een gensignatuur heeft, maar het kan nog steeds nuttig zijn.

Deze methoden passen doorgaans in een model dat een (klein) aantal genen selecteert uit genoombrede expressiegegevens die onderscheid maken tussen de celtypen / condities in kwestie, dwz ze ontlenen een gensignatuur. Het resulterende model maakt vervolgens de classificatie van nieuwe monsters mogelijk. Ik heb succes gehad met het gebruik van GeneRave voor dit doel (maar houd er rekening mee dat dit is ontworpen voor microarray-gegevens, ik heb het niet gebruikt met RNA-seq-gegevens en weet niet hoe goed het daar standhoudt ). Een recentere paper over dit probleem is hier te vinden.

Hoe helpt dat u? Een optie zou zijn om een ​​van deze classificatoren in te passen in genexpressiegegevens voor de genen die u al kent om een ​​model te verkrijgen dat vervolgens automatisch op nieuwe monsters kan worden toegepast.

Dat is echt nuttig, heel erg bedankt. Ik zal die proberen of in ieder geval kijken hoe ik hun methodes kan aanpassen.
Door verder te gaan met het voorbehoud van @Peter Humberg dat GeneRave is ontworpen voor microarray-gegevens, zou je je tellingen kunnen 'voom' transformeren met behulp van 'limma' om ze * microarray-achtig * te maken.
Wanneer ik cDNASeq-expressie moet vergelijken met microarray, gebruik ik een normalisatie van de transcriptlengte die wordt toegepast op DESeq's VST-transformatie (die ik 'VSTPk' noem). Meer details hierover zijn te vinden in de sectie methoden van onze Th2 RNASeq-paper: http://dx.doi.org/10.1084/jem.20160470


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...