probeset om toewijzingen tussen Affymetrix-arrays te testen

neilfws

2017-05-19 06:18:14 UTC

view on stackexchange narkive permalink

Als uw vraag is: kunnen probeset-ID's van verschillende platforms op dezelfde manier aan elkaar worden toegewezen als het toewijzen van probesets aan genen, dan is het antwoord: Ja. BioMart stelt je in staat om bijna alles dat een ID heeft toe te wijzen aan iets anders dat een ID heeft.

Je kunt BioMart gebruiken via de webinterface of programmatisch. Een korte handleiding voor het gebruik van de webinterface om HG U133 Plus 2 toe te wijzen aan HuGene 1.0:

Ga naar de startpagina
Selecteer H sapiens Ensembl-genen voor uw database; Menselijke genen (GRCh38.p10) voor uw dataset
Klik op Filters in de linkerkolom
Vouw "REGION" uit, scrol omlaag naar GENE en selecteer "Input microarray probes / probesets ID lijst [Max. 500 geadviseerd] "
Selecteer AFFY HG U133 PLUS 2 sonde-ID ('s) en kopieer / plak of upload een lijst, één per regel
Klik op Attributen aan de linkerkant -hand kolom
Blader door, vink uit wat u niet wilt zien en kies wat u doet, bijvoorbeeld Gene Stable ID, AFFY HuGene 1 0 st v1-sonde en AFFY HG U133 Plus 2-sonde
Klik ten slotte op 'Resultaten' in het menu bovenaan de linkerkolom.

En je zou een resultaat als dit moeten zien (je Ik zal op de knop "Resultaten" moeten klikken).

Je moet niet verwachten dat er een één-op-één mapping is, om twee redenen:

Genen hebben meerdere transcripten en probesets worden toegewezen aan elk transcript.
Sommige transcripten hebben meer dan één probeset: in dit geval verwijzen de HuGene ID's 8002301 en 8002303 naar transcripten voor dit gen

Eindelijk: hier is een programmavoorbeeld met R / BioMart:

  bibliotheek (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") resultaten <- getBM (attributes = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filters = "affy_hg_" 2103 waarden, cf. .hs) resultaten ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at

rmflight

2017-05-19 06:53:56 UTC

view on stackexchange narkive permalink

In plaats van biomaRt is het ook mogelijk om de mapping-databases te gebruiken die in Bioconductor zelf zijn ingebouwd, en om van sonde naar gen en vervolgens van gen naar sonde in de tweede in kaart te brengen. Sommige R-code om te converteren tussen hgu133 en hgu95 met dezelfde probe-ID als opgegeven in een andere:

  bibliotheek (hgu133plus2.db) bibliotheek (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, columns = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", columns = "PROBEID") dplyr :: inner_emblens_hgu13 , door = "ENSEMBL", achtervoegsel = c (". 133", ".95"))

rmflight

2017-05-19 06:57:32 UTC

view on stackexchange narkive permalink

Andere antwoorden verklaren waarom er misschien niet één-op-één mapping tussen de probes is.

De AbsID-database voert conversie uit op basis van het in kaart brengen van de probesequenties naar een genoomopbouw, en bepaalt vervolgens toewijzingen op basis van overlappende genoomuitlijningscoördinaten. Dit is erg handig als u zeker wilt weten dat twee sondes werkelijk waarschijnlijk hetzelfde transcript meten.

Het is echter afhankelijk van het feit of beide sondes zijn uitgelijnd met het genoom.

Disclaimer: ik werkte in de groep die de AbsID-mappingtool levert.