Vraag:
Hoe kan de bijdrage van de cellijn worden geschat op basis van RNASeq-gegevens?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

Met behulp van een lasermicrodissectie van cellen werd de sequentie bepaald van een groep cellen die was gekleurd met de marker van belang. In een ander cohort van patiënten (dit is allemaal menselijk leverweefsel) werd de sequentie bepaald (RNA-seq in beide gevallen)

Kan ik de bijdrage van de gemarkeerde cellen in de hele lever schatten ("gewicht van deze cellen 'in de lever in de woorden van mijn PI)?

Mijn gevoel is dat het niet op deze manier kan worden gedaan, het zou zowel eencellige sequentiebepaling als volledige weefselsequentiebepaling vereisen om de bijdrage van elke cellijn. Maar misschien is er een hulpmiddel dat, gezien de cellijnen of de belangrijkste expressie van andere cellijnen, vergeleken kan worden met het gebruik van GSVA of een soortgelijk hulpmiddel.

Heb je gekeken naar hulpmiddelen voor het schatten van bijmengsels (dat is wat je doet)? Hoe nauwkeurig moet de schatting zijn?
Ik heb nog nooit gehoord van het schatten van bijmengingen, dus ik heb geen tools met dat trefwoord gezocht. Ik heb geen vereiste van precisie, hoe meer, hoe beter: D. Maar ik vermoed dat mijn gegevens niet al te goed zijn (ik heb slechts 6 technische replica's van de lasermicrodissectie), dus ik kan niet veel verwachten.
Vier antwoorden:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

Er zijn een aantal computationele methoden die dit proberen (ik heb ze nooit gebruikt, dus geen ervaring):

  1. CellMix, gebaseerd op sets van markergen lijsten
  2. Voorspelling van subsets op basis van verrijkingscorrelatie, die is gebaseerd op correlaties met subset-specifieke genen in een reeks monsters.
  3. Verrijking van het celtype, die gebruikmaakt van onze sterk tot expressie gebrachte, celspecifieke gendatabase.
  4. Celtype-specifieke significantieanalyse met behulp van differentiële genexpressie voor elk celtype
  5. ol >

    Misschien moet je voor sommige methoden een aantal referentie-expressieniveaus halen uit openbare databases of papers.

    Een ding om in gedachten te houden: je kunt de celverhouding niet echt berekenen, alleen de RNA-verhouding. Als je een goede reden hebt om aan te nemen dat de hoeveelheid RNA per cel erg op elkaar lijkt, is dit een goede maatstaf voor de celverhouding in een weefsel.

Leuke referenties. Ik zal die beperking in gedachten houden. Bedankt
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

Celdeconvolutie wordt genoemd in deze Biostars-post, waarin CIBERSORT voor immuuncelmengsels wordt genoemd, en het Bioconductor-pakket DeconRNASeq.

Voor zover Ik ben me ervan bewust dat het op zijn best alleen mogelijk is om een ​​proportionele weergave te krijgen voor transcriptie-expressie van standaard high-throughput sequencing-resultaten, omdat de sequencers en de samplebereidingsworkflow zo zijn ontworpen dat hetzelfde aantal reads wordt uitgevoerd, ongeacht de ingevoerd bedrag.

CIBERSORT klinkt als een leuke tool, het proberen waard.
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

U kunt ter referentie openbare eencellige RNA-seq-gegevens of bulk-RNA-seq voor gezuiverde primaire cellen downloaden en vervolgens CIBERSORT of MuSiC gebruiken om te deconvolueren. compatibel, kan TPM van RNA-seq worden vergeleken met CPM in 3 '(10X, Drop-seq enz.) eencellige gegevens en TPM in volledige eencellige gegevens (SMARTseq enz.)

#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

Een maand geleden was ik eigenlijk op zoek naar dezelfde vraag en ik vond een paar pakketten die kunnen worden gebruikt. Allereerst kan de functionaliteit ervan het schatten van de celaandelen, celspecifieke genexpressie of beide functies zijn. Ten tweede is hun primaire input, zoals verwacht, bulk RNA-seq data en sommigen willen ook single cell RNA-seq data als secundaire input. De meest populaire is het kind van de beroemde cibersort, CIBERSORTX. Ik ging door hun website en las de tutorials. Ze hebben verschillende voorbeelddatasets die kunnen worden gebruikt om hun platform te leren kennen. De twee grootste tekortkomingen waren echter dat ze hun broncode niet hebben gedeeld, wat betekent dat we het resultaat niet op onze eigen systemen kunnen reproduceren en dat we al onze gegevens moeten uploaden naar Stanford-servers (veiligheidsproblemen!). Het tweede probleem is dat er geen API-toegang tot hun server is en dat alles online moet gebeuren, wat een zeer lage compatibiliteit met andere tools betekent.

Het idee, deconvolutie en diep leren gebruiken om subpopulatie van cellen af ​​te leiden uit bulk RNA-seq, is geweldig. Dus ik zocht om te zien of anderen ook iets soortgelijks en misschien zelfs beter hebben gedaan. Ik heb drie andere tools gevonden:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    Gepubliceerd in natuurcommunicatie en enkele maanden ouder dan cibersortx. Ik heb hun algoritme nog niet bestudeerd en dus kan ik niet zeggen of hun methode beter is dan cibersortx of niet. Het deel dat echter het verschil maakt, is dat al hun werken, inclusief hun broncode, open-source zijn. Dus ik heb toegang tot hun code en we hoeven onze niet-gepubliceerde gegevens niet te uploaden naar een niet-veilige online server (in tegenstelling tot cibersortx). Het tweede goede is dat het is geïmplementeerd in de R-taal die ik gebruik voor de meeste van mijn RNA-seq data-analyse, dus het is gemakkelijk compatibel met andere tools.

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full Deze is ook open-source en gemakkelijk toegankelijk. Het is geschreven in Python en draait in de shell. Het is dus enigszins compatibel met andere tools (niet zo compatibel als MuSic). We kunnen onze gegevens weer lokaal verwerken en hoeven onze gegevens niet naar servers te uploaden (wat goed is). Ze beweren dat hun methode een betere correlatie heeft met de echte scRNA-seq-gegevens dan zowel cibersortx als MuSic (niet altijd !!). Het lijkt eenvoudig om hun tools uit te voeren op basis van hun tutorials (ik heb het nog niet op mijn systeem uitgevoerd!). Hun tutorials lijken echter een beetje verwarrend en het lijkt erop dat het nog in een pre-releaseversie is en dat ze bugs hebben !!

  3. CDSeq: https: / /github.com/kkang7/CDSeq_R_Package Ten slotte vond ik het CDSeq-pakket dat geen scRNA-seq-invoer nodig heeft om de verhoudingen van een enkele cel en celspecifieke genexpressie in bulkgegevens te vinden. Het krijgt gewoon je buld-tellingen als invoer en info over heel weinig parameters en doet het hele ding automatisch, en verrassend goed, ik heb het gecontroleerd! Als u het genexpressiepatroon van uw specifieke cellen zou kunnen vinden en het ook als invoer zou kunnen gebruiken, is dit optioneel, het geeft u een nog betere schatting.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...