Wir haben jetzt den größten menschlichen „Stammbaum“ aller Zeiten mit 231 Millionen Ahnenlinien

Ausbreitung menschlicher Populationen (Wohns et al., Science, 2022)

Im Juni 2000 bildeten sich zwei rivalisierende Forschergruppen gaben sich die Hand am gemeinsamen Erfolg eines Meilensteins in der Biologie – der Bereitstellung eines Rohentwurfs des menschlichen Genoms.

Was mit einer unvollständigen Karte unserer Chromosomen begann, hat sich inzwischen zu einer solchen entwickelt eine riesige Fundgrube an individualisierten Sequenzen aus allen Teilen der Welt, und in vielen Fälle weit zurück in die Zeit reichen .

Irgendwo in diesem Ozean entschlüsselter DNA liegt die Geschichte unserer gemeinsamen Menschlichkeit.

Leider ist das Lesen leichter gesagt als getan. Nicht nur die schiere Datenmenge ist ein Problem, auch subtile Unterschiede in den Stichproben, unterschiedliche Formate und Analysetechniken, die verschiedene Arten von Fehlern priorisieren, stellen allesamt Hindernisse für eine einheitliche Interpretation dar.

Jetzt haben Forscher des Big Data Institute (BDI) der Universität Oxford im Vereinigten Königreich einen bedeutenden Anfang gemacht, indem sie einen Wald aus mehr als 3.600 Einzelsequenzen aus 215 Populationen zu einem einzigen, riesigen Baum zusammengeführt haben.

Die Äste des Baumes bestehen aus überwältigenden 231 Millionen Ahnenlinien. An seiner Basis liegt eine Reihe von Wurzeln, die durch acht alte, sehr detaillierte menschliche Genomsequenzen repräsentiert werden, wobei Tausende kleinerer Schnipsel verwendet werden, um ihren Platz tief in unserer Vergangenheit zu bestätigen.

Unter ihnen sind drei Neandertaler Genome, ein Genom aus a Denisovan und eine kleine Familie, die vor mehr als viertausend Jahren in Sibirien lebte.

„Im Wesentlichen rekonstruieren wir die Genome unserer Vorfahren und nutzen sie, um eine Reihe miteinander verbundener Evolutionsbäume zu bilden, die wir ‚Baumsequenz‘ nennen.“ sagt Der Genetiker Anthony Wilder Wohns, der die Studie während seiner Promotion am BDI leitete.

„Wir können dann abschätzen, wann und wo diese Vorfahren lebten.“

Ihre Baumsequenzmethode nutzt eine sogenannte prägnante Datenstruktur – ein Computerkonzept, das darauf abzielt, Daten in einem optimalen Raum darzustellen und gleichzeitig den Zeitaufwand für die Untersuchung des Ganzen mit Fragen zu begrenzen.

Wir denken möglicherweise ähnlich, wenn wir Dateien auf unserem eigenen Computer speichern und einen Kompromiss zwischen der Komprimierung von Dokumenten und deren Unterbringung in langen Ordnerlisten finden oder einfach alles auf dem Desktop speichern.

In diesem speziellen Fall findet eine Baumsequenz Korrelationen zwischen verschiedenen Zweigen eines Baums, um das Studium der großen Informationspools zu erleichtern.

Durch die Umwandlung der Daten in Diagramme mit Knoten, die verschiedene Abstammungslinien darstellen und Mutationen an den Rändern abbilden, können riesige genetische Datenbanken nicht nur auf relativ kleinem Raum zusammengedrückt werden, sondern auch einfacher auf Algorithmen zugreifen, die für die Suche nach interessanten Statistiken konzipiert sind.

„Die Stärke unseres Ansatzes besteht darin, dass er nur sehr wenige Annahmen über die zugrunde liegenden Daten trifft und sowohl moderne als auch alte DNA-Proben einbeziehen kann“, sagt Wohns, die ihre Arbeit im Video unten näher erläutert.

Durch die Einbeziehung von Beschriftungen auf die geografischen Standorte von Sequenzen konnte das Team abschätzen, wo bestimmte gemeinsame Vorfahren einst gelebt haben könnten und wie sie sich bewegten.

Dies enthüllt nicht nur Ereignisse, die wir bereits vermuten, wie zum Beispiel die Entwicklung menschlicher Populationen aus Afrika eingewandert , es weist auf Veränderungen in der Bevölkerungsdichte innerhalb von Vorfahrengruppen hin, über die wir noch etwas erfahren, wie zum Beispiel die Denisovaner .

Dank der Effizienz dieses Prozesses hat der bereits beeindruckende Baum viel Raum zum Wachsen, wenn in Zukunft weitere genetische Daten verfügbar werden.

Durch das Hinzufügen von Millionen weiterer Genome werden alle weiteren Ergebnisse nur noch genauer und können genau bestimmen, wo eine neuartige Sequenz in eine Genealogie passt, die sich über die ganze Welt erstreckt.

„Diese Genealogie ermöglicht es uns zu sehen, wie sich die genetische Sequenz jedes Menschen an allen Punkten des Genoms zueinander verhält.“ sagt BDI-Evolutionsgenetiker Yan Wong.

Wenn man noch größer denkt, gibt es keinen Grund, warum der gleiche Ansatz nicht auch sein könnte auf andere Arten angewendet , möglicherweise eines Tages zu einem globalen Teppich des Lebens auf der Erde beitragen.

„Obwohl der Mensch im Mittelpunkt dieser Studie steht, ist die Methode für die meisten Lebewesen gültig; von Orang-Utans bis zu Bakterien“, sagt Wohns.

„In der medizinischen Genetik könnte es besonders nützlich sein, wenn es darum geht, echte Zusammenhänge zwischen genetischen Regionen und Krankheiten von falschen Verbindungen zu trennen, die sich aus unserer gemeinsamen Vorfahrengeschichte ergeben.“

Diese Forschung wurde veröffentlicht in Wissenschaft .

Über Uns

Die Veröffentlichung Unabhängiger, Nachgewiesener Fakten Von Berichten Über Gesundheit, Raum, Natur, Technologie Und Umwelt.