Vraag:
Waarin verschillen de algoritmen voor smalle piek en brede piek van MACS2?
Ian Sudbery
2017-05-20 05:21:09 UTC
view on stackexchange narkive permalink

De tool MACS2 voor het aanroepen van pieken kan pieken oproepen in ofwel de modus voor smalle piek (voor gerichte signalen zoals transcriptiefactor ChIPseq) of modus voor brede piek (voor meer onschadelijke signalen, zoals bepaalde histon-modificaties).

Het algoritme voor narrow peak calling is goed beschreven in de MACS-publicatie. Maar ik vind niet veel documentatie over hoe pieken bellen verschilt in brede piekmodus. De handleiding bevat alleen het volgende:

--broad

Als deze vlag is ingeschakeld, zal MACS proberen om brede regio's samen te stellen in BED12 (een genmodelachtig formaat ) door nabijgelegen sterk verrijkte regio's in een brede regio te plaatsen met losse afsnijding. De brede regio wordt beheerst door een andere cutoff door --brede cutoff. De maximale lengte van de brede regielengte is 4 keer d van MACS.

Maar dit beschrijft niet echt precies hoe dit wordt uitgevoerd.

Dus wat is het algoritme dat MACS gebruikt om brede pieken aan te roepen?

Ik vond het [algoritme] (https://github.com/taoliu/MACS/blob/24a1eab9fe7e885c27a37dbac2efb99d6da8dc74/MACS2/IO/BedGraph.pyx#L594), maar eerlijk gezegd kon ik niet echt proberen / behalve constructie op lijn 629. ..
Een antwoord:
#1
+10
Daniel Kim
2017-05-21 02:38:55 UTC
view on stackexchange narkive permalink

De sleutelfunctie is call_broadpeaks :

De beschrijving bij de functie zegt:

Deze functie probeer verrijkte regio's te vinden waarbinnen scores continu hoger zijn dan een bepaalde cutoff voor niveau 1, en koppel ze met behulp van de gap boven de cutoff van niveau 2 met een maximale lengte van lvl2_max_gap.

scoring_function_s: symbolen van functies aan score berekenen. 'p' voor pscore, 'q' voor qscore, 'f' voor fold change, 's' voor aftrekken. bijvoorbeeld: ['p', 'q']

lvl1_cutoff_s: lijst met cutoffs in sterk verrijkte regio's, overeenkomend met scorefuncties.

lvl2_cutoff_s: lijst met cutoffs in minder verrijkte regio's , corresponderend met scorefuncties.

min_length: minimale pieklengte, standaard 200.

lvl1_max_gap: maximale tussenruimte om nabijgelegen verrijkte pieken samen te voegen, standaard 50.

lvl2_max_gap : maximale lengte van koppelingsregio's, standaard 400.

Retourneer zowel algemeen PeakIO-object voor sterk verrijkte regio's als gapped brede regio's in BroadPeakIO.

Om wat basisuitleg te geven, het algoritme (kort) lijkt er als volgt uit te zien:

  1. Twee afzonderlijke niveaus van pieken worden genoemd, niveau 1 (een hoger pval, dwz meer significant) en niveau 2 (een lager pval ). Niveau 1 wordt bestuurd door -p en niveau 2 wordt bestuurd door --broad-cutoff . Wanneer elke peakset wordt aangeroepen, worden ze onmiddellijk gekoppeld door de max gap-parameter voor elke set.

  2. Vervolgens, ervan uitgaande dat alle pieken van niveau 1 binnen pieken van niveau 2 moeten liggen (dit is een expliciete aanname van MACS2), piekt de algoritmegroep niveau 1 binnen niveau 2 pieken om een ​​brede piek uit te voeren.

...

Dit heeft enkele implicaties:

  1. De brede piekoproepen komen eigenlijk alleen van de niveau 2-pieken (+ koppeling). Met de piekoproepen van niveau 1 kunt u subpieken onderscheiden (zodat u tussenliggende pieken kunt hebben).

  2. Afgezien van het linken, zouden de brede piekoproepen hetzelfde zijn als de smalle piekoproepen, als je beide zou aanroepen met dezelfde pvaldrempel (bijvoorbeeld als je --broad-cutoff 0.1 in brede piekmodus en de -p 0.1 voor smalle piekmodus)

Kunt u in uw antwoord verduidelijken dat "hogere pval" eigenlijk "lagere" of "meer significante" p-waarde is en dat "lagere pval" eigenlijk "hogere" of "minder significante" p-waarde is? Ik voorzie dat iemand in de war raakt door de bewoordingen.
Een verduidelijking toegevoegd - bedankt voor de vangst!


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...