Das Menschliche Genom Wurde Nie Vollständig Sequenziert
Das Menschliche Genom Wurde Nie Vollständig Sequenziert

Video: Das Menschliche Genom Wurde Nie Vollständig Sequenziert

Video: Ist die Genesis Geschichte? - Ganzen Film ansehen 2022, Dezember
Anonim

Die 2003 abgeschlossenen Bemühungen verwendeten die beste verfügbare Technologie, aber jetzt konnten Wissenschaftler mehr tun.

Das menschliche Genom wurde nie vollständig sequenziert
Das menschliche Genom wurde nie vollständig sequenziert

Das Kunststück machte weltweit Schlagzeilen: "Wissenschaftler sagen, dass das menschliche Genom vollständig ist", kündigte die New York Times 2003 an. "Das menschliche Genom", sagten die Zeitschriften Science and Nature in identischen Ta-dah-Titelzeilen, in denen die historische Errungenschaft enthüllt wurde.

Es gab ein kleines Problem.

"In der Werbung ist die" fertige "Sequenz noch nicht fertig", sagte Eric Lander, der das Labor am Whitehead Institute leitete, das mehr Genom für das von der Regierung finanzierte Humangenomprojekt entschlüsselte als jedes andere. "Ich sage immer" fertig "ist ein Kunstbegriff."

"Es ist sehr fair zu sagen, dass das menschliche Genom nie vollständig sequenziert wurde", sagte Craig Venter, ein weiterer Genomik-Star, gegenüber STAT.

"Das menschliche Genom wurde meines Wissens nicht vollständig sequenziert und auch kein anderes Säugetiergenom", sagte George Church, Bioingenieur der Harvard Medical School, der wichtige frühe Fortschritte in der Sequenzierungstechnologie erzielt hat.

Lesen Sie mehr: Der Genetiker Craig Venter half bei der Sequenzierung des menschlichen Genoms. Jetzt will er deins.

Was Insider jedoch wissen, ist für den Rest von uns nicht gut verstanden. Wir gehen davon aus, dass jedes A, T, C und G, aus dem die DNA aller 23 Paare menschlicher Chromosomen besteht, vollständig ausgearbeitet wurde. Als die Wissenschaftler 2001 den ersten Entwurf des menschlichen Genoms fertigstellten und 2003 erneut die endgültige Version hatten, log niemand genau. FAQs der National Institutes of Health beziehen sich auf die "wesentliche Vervollständigung" der Sequenz und auf die Frage: "Ist das menschliche Genom vollständig sequenziert?" Sie antworten mit der Einschränkung "Ja" - dass es angesichts der verfügbaren Technologie "so vollständig wie möglich" ist.

Vielleicht hat niemand viel Aufmerksamkeit geschenkt, weil die fehlenden Sequenzen keine Rolle zu spielen schienen. Aber jetzt scheint es, dass sie eine Rolle bei Erkrankungen wie Krebs und Autismus spielen können.

"Viele Menschen in den 1980er und 1990er Jahren [als das Humangenomprojekt begann] betrachteten diese Regionen als nicht funktionsfähig", sagte Karen Miga, Molekularbiologin an der University of California in Santa Cruz. "Aber das ist nicht mehr der Fall." Einige von ihnen, sogenannte Satellitenregionen, verhalten sich bei einigen Krebsarten schlecht. "In diesen Regionen ist also etwas los, das wichtig ist."

Miga betrachtet sie als den Entdecker, den Livingstone in Afrika gemacht hat - terra incognita, dessen Unzugänglichkeit wie eine persönliche Beleidigung erscheint. Die Sequenzierung der nicht sequenzierten, sagte sie, "ist die letzte Grenze für Humangenetik und Genomik."

Auch Church hat darauf hingewiesen und dies sowohl auf der Mai-Sitzung zur Synthese von Genomen als auch auf der Sitzung der Internationalen Gesellschaft für Stammzellforschung am vergangenen Wochenende erwähnt. Die meisten nicht sequenzierten Regionen, sagte er, "haben einen gewissen Zusammenhang mit Alterung und Aneuploidie" (eine abnormale Anzahl von Chromosomen, wie sie beim Down-Syndrom auftreten). Church schätzt, dass 4 bis 9 Prozent des menschlichen Genoms nicht sequenziert wurden. Miga glaubt, dass es 8 Prozent sind.

Der Grund für diese Lücken ist, dass DNA-Sequenzierungsmaschinen keine Genome lesen, wie Menschen Bücher lesen, vom ersten bis zum letzten Wort. Stattdessen zerhacken sie zunächst nach dem Zufallsprinzip Kopien der 23 Chromosomenpaare, die insgesamt etwa 3 Milliarden "Buchstaben" umfassen, damit die Maschinen nicht überfordert werden. Die resultierenden Blöcke enthalten 1000 Buchstaben (während des Humangenomprojekts) bis einige Hundert (in den heutigen fortschrittlicheren Sequenziermaschinen). Die Stücke überlappen sich. Computer gleichen die Überlappungen ab und setzen die Blöcke in der richtigen Reihenfolge zusammen.

Dies ist schwierig und unmöglich, wenn die Chunks viele sich wiederholende Segmente enthalten, z. B. TTAATATTAATATTAATA oder TTAATA dreimal. "Das Problem ist, wenn Sie genau die gleichen Wörter haben, ist es schwierig, sie zusammenzusetzen", sagte Lander, als ob Puzzleteile genau den gleichen blauen Himmel zeigen würden.

Im Jahr 2004 berichtete das Genomprojekt, dass es 341 Lücken in der Sequenz gab. Die meisten Lücken - 250 - befinden sich im Hauptteil jedes Chromosoms, wo Gene die Proteine ​​bilden, auf denen das Leben läuft. Diese Lücken sind winzig. Nur wenige Lücken - 33 zuletzt gezählt - liegen im oder in der Nähe des Zentromers jedes Chromosoms (wo sich die beiden Teile eines Chromosoms verbinden) und der Telomere (die Kappen am Ende der Chromosomen), aber diese 33 sind insgesamt zehnmal so lang wie die 250 Lücken.

Das macht die Zentromere insbesondere zum unbekannten Sambesi des Genoms. Evan Eichler von der University of Washington sagte, jedes Chromosom habe solche sequenzwidrigen repetitiven Elemente - betrachten Sie sie als DNA-Stottern - einschließlich eines berüchtigten, das 171 Buchstaben lang ist und sich für Tausende von Buchstaben durchgehend wiederholt.

Zu Beginn des Humangenomprojekts sagte Lander, jetzt Direktor des Broad Institute of MIT und Harvard: „Es wurde sehr klar, dass diese sich stark wiederholenden Sequenzen mit der vorhandenen Technologie nicht nachvollziehbar sind. Es war zu dieser Zeit kein Grund für große Qualen “, da er und andere Projektleiter erwarteten, dass die nächste Generation von Wissenschaftlern eine Lösung finden würde.

Das ist nicht wirklich passiert, auch weil es nicht viel Motivation gab, diese Regionen zu kartieren. "Ich bin zwischen Agnostiker und ein wenig skeptisch, dass diese Teile für Krankheiten wichtig sind, aber vielleicht sage ich das, weil wir sie nicht lesen können", sagte Lander.

Als neue Sequenzierungstechnologien begonnen haben, die es Wissenschaftlern ermöglichen, in nicht sequenziertes Gebiet zu blicken, haben sie jedoch festgestellt, dass „diese schwer zu sequenzierenden Regionen häufig wichtige Gene aufweisen“, sagte Michael Hunkapiller, Vorsitzender und CEO von Pacific Biosciences, Hersteller von DNA-Sequenzierern. (1998 rekrutierte Hunkapiller Venter für seine neue Firma Celera Genomics, um das von der Regierung unterstützte Genomprojekt zu starten.)

PacBios "Grund zu sein" ist, die Länge der DNA-Segmente zu erhöhen, die gelesen und zusammengesetzt werden können, sagte Hunkapiller. Längere Lesevorgänge wirken sich wie das Vergrößern von Puzzleteilen aus. Obwohl die Teile immer noch viel blauen Himmel enthalten, ist es aufgrund der Größe wahrscheinlicher, dass sie auch etwas enthalten, das neu genug ist, um die Montage zu vereinfachen. Laut Hunkapiller beträgt der maximale DNA-Lesevorgang von PacBio jetzt etwa 60.000 Buchstaben und durchschnittlich 15.000.

Mit so langen Lesungen sagte Lander: "Sie könnten durch viele dieser fiesen [nicht sequenzierten] Regionen kommen."

Lesen Sie mehr: „Genomschreiber“versammeln sich in New York, um Bombenschnüffler und mehr zu werfen. Wo ist die Finanzierung?

Das sieht immer mehr nach einem würdigen Unterfangen aus, und das nicht nur, weil die nicht sequenzierten Regionen tatsächlich Gene zur Proteinherstellung enthalten könnten. Es gibt Hinweise darauf, dass die Nicht-Gen-Teile - insbesondere die DNA-Stottern - „eindeutig Auswirkungen auf die Krankheit haben“, sagte Hunkapiller. "Drei Viertel der [Genom-] Unterschiede zwischen einer Person und einer anderen sind in [solchen] Varianten" und nicht die Unterschiede in der Rechtschreibung einzelner Buchstaben bei A, T, C und G, die die ganze Aufmerksamkeit erregen. In einer Arbeit von 2007 haben Venter und sein Team gezeigt, dass es mehr solche Unterschiede von Person zu Person gibt, die als Strukturvarianten bezeichnet werden, als Änderungen in Einzelbuchstaben.

Dennoch wurden etwa 90 Prozent der Strukturvarianten, von denen die überwiegende Mehrheit weder durch das Genomprojekt noch durch einen späteren Versuch namens 1000 Genomes Project sequenziert wurde, "übersehen", berichteten Eichler und seine Kollegen im vergangenen Jahr.

Ein Grund, warum die Stottern ungewöhnlich einflussreich sind, ist, dass sich diese sich wiederholende DNA bewegen, Kopien von sich selbst erstellen, ihre Ausrichtung ändern und andere Akrobatik betreiben kann, die „ziemlich dramatische funktionelle Effekte haben kann“, sagte Hunkapiller. Zum einen könnten sich wiederholende Elemente um die Zentromere, sogenannte Satelliten, dazu führen, dass eine sich teilende Zelle krebsartig wird, sagte Miga, weil sie das gesamte Genom destabilisieren können.

Als Forscher der Stanford University versuchten, die genetische Ursache für die mysteriöse Krankheit eines jungen Mannes zu finden, die dazu führte, dass nicht krebsartige Tumoren in seinem Körper wuchsen, fanden sie mit der Standardsequenzierung des gesamten Genoms nichts, sagte Hunkapiller. Aber die "langen Lesevorgänge", die die PacBio-Maschinen ermöglichten, "suchten nach strukturellen Varianten und fanden das Problem sofort", sagte er.

Das Stottern könnte sogar das sein, was uns menschlich macht. Einige dieser komplexen Duplikate "scheinen wichtig für die Entwicklung einer höheren neuroadaptiven Funktion zu sein" - auch bekannt als Gehirnentwicklung, sagte Eichler. Ein Gen namens ARHGAP11B, das durch eine solche Verdoppelung erzeugt wurde, bewirkt, dass der Kortex die unzähligen Falten entwickelt, die das komplexe Denken unterstützen. SRGAP2C, ebenfalls eine Duplikation, löst die Entwicklung des Gehirns aus.

"Dies sind neue Gene, die sich in den letzten Millionen Jahren speziell in unserer Linie entwickelt haben", sagte Eichler. Dieselben Duplikationen können auch zu DNA-Umlagerungen führen, die „mit neurologischen Entwicklungsstörungen wie Autismus und geistiger Behinderung verbunden sind“.

"Beende die Sequenz!" ist kein Sammelruf geworden, aber vielleicht sollte es so sein, sagte Venter: "Ich wäre der letzte, der Ihnen ein Zitat gibt, das besagt, dass wir uns nicht mit diesen [nicht sequenzierten] Regionen befassen müssen."

Neuauflage mit Genehmigung von STAT. Dieser Artikel erschien ursprünglich am 20. Juni 2017.

Beliebt nach Thema