Vraag:
Nauwkeurigheid van de originele menselijke DNA-datasets waarvan de sequentie is bepaald door Human Genome Project?
kenorb
2017-05-16 23:14:21 UTC
view on stackexchange narkive permalink

The Human Genome Project was het project van 'het bepalen van de sequentie van nucleotide-basenparen waaruit het menselijk DNA bestaat, en het identificeren en in kaart brengen van alle genen van het menselijk genoom'. Het werd in 2003 voltooid verklaard, d.w.z. 99% van het euchromatische menselijke genoom voltooid met een nauwkeurigheid van 99,99%.

Zijn de door HGP verstrekte datasets nog steeds nauwkeurig, of zo nauwkeurig als in 2003 werd beweerd?

Gezien de technologie in het verleden (zoals het gebruik van oude technieken), of een andere reden (nieuwere onderzoeken), is het mogelijk dat de datasets niet zo nauwkeurig zijn als oorspronkelijk verwacht?

Opgemerkt moet worden dat de reden waarom een ​​technologie wordt vervangen door een nieuwere, niet altijd is omdat de oude niet correct was. Soms is de nieuwere technologie op sommige aspecten iets minder nauwkeurig, maar zo veel goedkoper dat het de moeite waard is om over te schakelen. De sequencing- en assemblagetechnieken die werden gebruikt om de gegevens te genereren die ten grondslag liggen aan de eerste release van het menselijk genoom, waren mogelijk behoorlijk nauwkeurig. Dat gezegd hebbende, het gebruik van nieuwere technieken om op deze basis te verbeteren, zal natuurlijk nieuwere versies beter maken.
Twee antwoorden:
#1
+18
kevbonham
2017-05-16 23:37:07 UTC
view on stackexchange narkive permalink

Het HGP ontwikkelde het eerste "referentie" menselijke genoom - een genoom waarmee andere genomen konden worden vergeleken, en was eigenlijk een samenstelling van meerdere menselijke genoomsequenties.

Het standaard menselijke referentiegenoom wordt eigenlijk voortdurend bijgewerkt met grote en kleine herzieningen, een beetje zoals software. De nieuwste hoofdversie heet GRCh38, is uitgebracht in 2013 en heeft sindsdien een aantal kleine updates ondergaan.

Zijn de datasets die door HGP worden geleverd nog steeds correct?

Ja, in zekere zin, maar we hebben nu zeker betere informatie. Een manier om de kwaliteit van de assembly te meten, is dat de aanvankelijke release van de HGP honderdduizenden hiaten had - sequenties die niet konden worden opgelost (dit gebeurt vaak vanwege repetitieve sequenties). Het nieuwste referentiegenoom heeft minder dan 500 hiaten.

#2
+8
user172818
2017-05-17 00:40:38 UTC
view on stackexchange narkive permalink

Hoewel de kwaliteit van de menselijke referentie-assemblage blijft verbeteren, zitten er nog steeds fouten in. Een veelvoorkomend probleem is dat recente segmentale duplicaties in de referentie af en toe in één reeks worden samengevouwen. Een ander probleem is dat de centromere reeksen in de referentie computationeel worden gegenereerd, die waarschijnlijk verschillen van echte reeksen. Dergelijke problemen maken gegevensanalyses vaak gecompliceerd.

Je moet er ook rekening mee houden dat elk mens een ander genoom heeft. Een groot gebied met één kopie in het referentiegenoom kan twee kopieën hebben in een specifiek monster. Hoewel dit niet echt het probleem is met de referentie, zullen dergelijke wijzigingen in het aantal kopieën hetzelfde effect hebben als referentiefouten en uw pijplijnen verknoeien.

Er is nog steeds ruimte voor verbetering van het menselijke referentiegenoom. In sommige regio's zijn de CHM1- en CHM13 PacBio-assemblages beter dan het huidige referentiegenoom op grotere schaal. Illumina-bevolkingsgegevens kunnen tot een betere consensus leiden op het niveau van één basis. GRC brengt continu nieuwe patches uit voor de laatste assembly.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...