Vraag:
Wat zijn de de facto verplichte velden in een SAM / BAM-leesgroep?
mattm
2017-06-09 20:51:25 UTC
view on stackexchange narkive permalink

De SAM-specificatie geeft aan dat elke leesgroep een uniek ID-veld moet hebben, maar markeert geen enkel ander veld zoals vereist.

Ik heb ook ontdekt dat htsjdk uitzonderingen genereert als het sample (SM) -veld leeg is, hoewel er geen indicatie in de specificatie is dat dit vereist is.

Zijn er andere leesgroepvelden waarvan ik mag verwachten dat ze vereist zijn voor gewone tools?

Twee antwoorden:
user172818
2017-06-09 21:28:09 UTC
view on stackexchange narkive permalink

De voorbeeldtag (d.w.z. SM) was een verplichte tag in de oorspronkelijke SAM-specificatie (zie het .pages -bestand; je hebt een mac nodig om het te openen). Bij de overgang naar latex werd deze vereiste op mysterieuze wijze geschrapt. Picard voldoet aan de oorspronkelijke specificaties. Hoe dan ook, de voorbeeld-tag is belangrijk voor heel wat tools. Ik zou je willen aanmoedigen om het toe te voegen.

Het mysterie werd uitgelegd in een [toenmalig samtools-devel-bericht] (https://sourceforge.net/p/samtools/mailman/message/25788014/): _Soms willen we gewoon lezingen groeperen zonder voorbeeldinformatie_. Zie ook [hts-specs issue # 286] (https://github.com/samtools/hts-specs/issues/286).
gringer
2017-06-09 21:01:18 UTC
view on stackexchange narkive permalink

De leesgroep-ID moet worden gespecificeerd in zowel de koptekstregels van het BAM / SAM-bestand als de uitlijningsregel. Er zijn geen andere velden vereist, maar houd er rekening mee dat omdat de aanvullende informatie maar één keer wordt opgeslagen (d.w.z. in de koptekst), het niet veel toevoegt aan de bestandsgrootte of verwerkingstijd als er extra velden worden toegevoegd. Als een van de andere optionele velden problemen veroorzaakt (door opname of uitsluiting), zou het handig zijn om een probleem te melden hierover.

Bij oudere tools moest je zowel een header read group ID en een alignment read group ID, maar de meeste tools van de recente tools die ik heb gebruikt, lijken intelligent genoeg te zijn om headers toe te voegen voor alle leesgroepen zonder die informatie.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...