Vraag:
probeset om toewijzingen tussen Affymetrix-arrays te testen
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Ik ben geïnteresseerd in het identificeren van mappings tussen verschillende typen Affymetrix-arrays. Ik ben me ervan bewust dat toewijzingen tussen gen en probeset kunnen worden geëxtraheerd met behulp van de Biomart-database van Ensembl.

  Ensembe-gen-id ENSG00000181019 komt overeen met 1. AFFY HG-U133_Plus_2's 210519_s_at2. AFFY HuGene-1_0-st-v1's 8002303  

Is er een manier om toewijzingen van probeset-id's tussen twee arrays te extraheren (bijv .: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  bijv .: 210519_s_at en 8002303  
Is uw vraag hoe u overlappende tastersets tussen arrays kunt vinden? Of hoe sondesets in het algemeen te identificeren? Het is niet duidelijk.
Ik heb een voorbeeld toegevoegd. Klopt dit nu?
Dus eigenlijk kun je twee gen-id-toewijzingen ophalen uit Ensembl's Biomart. Correct? Wat weerhoudt je ervan om aan deze twee tabellen deel te nemen op basis van de Ensembl-gen-id? U kunt de functie `merge` gebruiken in R of de instructie` JOIN` in SQL.
@IakovDavydov of een Unix `join` zou ook werken
Het probleem is: alle toewijzingen zijn niet precies één-op-één. Ofwel probesets van HG-U133_Plus_2 of HuGene-1_0-st-v1 mapping naar één ensembl-gen-id.
@Prradep als u uitlegt wat het onderliggende probleem is dat u probeert op te lossen, kunnen we u wellicht beter advies geven
U hoeft niet per se een-op-een-toewijzingen te verwachten, zie mijn antwoord hieronder.
Drie antwoorden:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Als uw vraag is: kunnen probeset-ID's van verschillende platforms op dezelfde manier aan elkaar worden toegewezen als het toewijzen van probesets aan genen, dan is het antwoord: Ja. BioMart stelt je in staat om bijna alles dat een ID heeft toe te wijzen aan iets anders dat een ID heeft.

Je kunt BioMart gebruiken via de webinterface of programmatisch. Een korte handleiding voor het gebruik van de webinterface om HG U133 Plus 2 toe te wijzen aan HuGene 1.0:

  1. Ga naar de startpagina
  2. Selecteer H sapiens Ensembl-genen voor uw database; Menselijke genen (GRCh38.p10) voor uw dataset
  3. Klik op Filters in de linkerkolom
  4. Vouw "REGION" uit, scrol omlaag naar GENE en selecteer "Input microarray probes / probesets ID lijst [Max. 500 geadviseerd] "
  5. Selecteer AFFY HG U133 PLUS 2 sonde-ID ('s) en kopieer / plak of upload een lijst, één per regel
  6. Klik op Attributen aan de linkerkant -hand kolom
  7. Blader door, vink uit wat u niet wilt zien en kies wat u doet, bijvoorbeeld Gene Stable ID, AFFY HuGene 1 0 st v1-sonde en AFFY HG U133 Plus 2-sonde
  8. Klik ten slotte op 'Resultaten' in het menu bovenaan de linkerkolom.

En je zou een resultaat als dit moeten zien (je Ik zal op de knop "Resultaten" moeten klikken).

Je moet niet verwachten dat er een één-op-één mapping is, om twee redenen:

  • Genen hebben meerdere transcripten en probesets worden toegewezen aan elk transcript.
  • Sommige transcripten hebben meer dan één probeset: in dit geval verwijzen de HuGene ID's 8002301 en 8002303 naar transcripten voor dit gen

Eindelijk: hier is een programmavoorbeeld met R / BioMart:

  bibliotheek (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") resultaten <- getBM (attributes = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filters = "affy_hg_" 2103 waarden, cf. .hs) resultaten ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

In plaats van biomaRt is het ook mogelijk om de mapping-databases te gebruiken die in Bioconductor zelf zijn ingebouwd, en om van sonde naar gen en vervolgens van gen naar sonde in de tweede in kaart te brengen. Sommige R-code om te converteren tussen hgu133 en hgu95 met dezelfde probe-ID als opgegeven in een andere:

  bibliotheek (hgu133plus2.db) bibliotheek (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, columns = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", columns = "PROBEID") dplyr :: inner_emblens_hgu13 , door = "ENSEMBL", achtervoegsel = c (". 133", ".95"))  
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Andere antwoorden verklaren waarom er misschien niet één-op-één mapping tussen de probes is.

De AbsID-database voert conversie uit op basis van het in kaart brengen van de probesequenties naar een genoomopbouw, en bepaalt vervolgens toewijzingen op basis van overlappende genoomuitlijningscoördinaten. Dit is erg handig als u zeker wilt weten dat twee sondes werkelijk waarschijnlijk hetzelfde transcript meten.

Het is echter afhankelijk van het feit of beide sondes zijn uitgelijnd met het genoom.

Disclaimer: ik werkte in de groep die de AbsID-mappingtool levert.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...