Vraag:
Zijn fgsea en Broad Institute GSEA gelijkwaardig?
llrs
2017-05-19 17:32:54 UTC
view on stackexchange narkive permalink

Er zijn verschillende methoden voor het verrijken van genensets beschikbaar, de meest bekende / populaire is de Broad Institute-tool. Er zijn veel andere tools beschikbaar (zie bijvoorbeeld de biocView van GSE met 82 verschillende pakketten). Er zijn verschillende parameters in overweging:

  • de statistiek die wordt gebruikt om de genen te ordenen,
  • of het competitief of op zichzelf staand is,
  • als het onder toezicht staan ​​of niet,
  • en hoe wordt de verrijkingsscore berekend.

Ik gebruik het fgsea - Fast Gene Set Enrichment Analysis -pakket om bereken de verrijkingsscores en iemand vertelde me dat de getallen verschillen van die van het Broad Institute, ondanks dat alle andere parameters gelijkwaardig zijn.

Zijn deze twee methoden (fgsea en Broad Institute GSEA) gelijkwaardig om de verrijkingsscore?

Ik heb gekeken naar de algoritmen van beide artikelen, en ze lijken redelijk op elkaar, maar ik weet niet of ze in echte datasets equivalent zijn of niet.

Is er een artikel waarin wordt beoordeeld en vergeleken hoe de methode van de verrijkingsscore het resultaat beïnvloedt?

Twee antwoorden:
#1
+7
burger
2017-05-21 01:24:45 UTC
view on stackexchange narkive permalink

Volgens de FGSEA-preprint:

We hebben referentie GSEA uitgevoerd met standaardparameters. Het permutatiegetal was ingesteld op 1000, wat betekent dat voor elke inputgen-set 1000 onafhankelijke monsters werden gegenereerd. De run duurde 100 seconden en resulteerde in 79 genensets met GSEA-gecorrigeerde FDR q-waarde van minder dan 10 - 2. Alle significante genensets waren in een positieve modus. Ten eerste, om een ​​vergelijkbare nauwkeurigheid van de nominale p-waarden te krijgen, hebben we het FGSEA-algoritme op 1000 permutaties uitgevoerd. Dit duurde 2 seconden, maar resulteerde niet in significante treffers na meervoudige testcorrectie (met FRD ≤ 1%).

FGSEA en GSEA zijn dus niet identiek.

En nogmaals in de conclusie:

Bijgevolg kunnen genensets nauwkeuriger in de resultaten worden gerangschikt en, wat nog belangrijker is, standaard meerdere testcorrectiemethoden kunnen worden toegepast in plaats van benaderende, zoals in [GSEA].

De auteur stelt dat FGSEA nauwkeuriger is, dus het kan niet equivalent zijn.

Als je specifiek geïnteresseerd bent in de verrijkingsscore, dat werd door de auteur aangepakt in de preprint-opmerkingen:

De waarden van verrijkingsscores en genormaliseerde verrijkingsscores zijn hetzelfde voor zowel de brede versie als voor fgsea.

Dus dat deel lijkt hetzelfde te zijn.

Ja, de preprint vertelt veel over hoe de p-waarden anders worden berekend, maar ik vroeg me af of de verrijkingsscores hetzelfde zijn of niet, ik was me bewust van de verschillende manieren om de p-waarden te berekenen. Ik vind het antwoord bij de auteur zelf
Sorry. Ik wist niet dat je specifiek naar de verrijkingsscore vroeg. Misschien wilt u de vraag bewerken om dat duidelijker te maken.
#2
+4
llrs
2017-05-21 15:41:34 UTC
view on stackexchange narkive permalink

Ik ontdekte dat de auteur antwoordde dat in de discussie in de preprint,

Ik vraag me af of de verrijkingsscore op dezelfde manier wordt berekend als in brede gsea?

Waarden van verrijkingsscores en genormaliseerde verrijkingsscores zijn hetzelfde voor zowel de brede versie als voor fgsea.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...