Y-DNA, Haplogruppe und Genealogie

Y-DNA, Haplogruppe und Genealogie

Einstieg, Tests für DNA

Ich will meine DNA testen. Welchen Test soll ich nehmen?
Diese Frage liest man oft, so oder ähnlich, in diversen Foren, doch ohne eine Glaskugel wird es schwierig darauf eine Antwort zu finden, wenn man die Intentionen des Fragenden nicht kennt. Nur solche mit ausreichendem Informationsgehalt, können akkurat beantwortet werden. Zu aller erst sollte sich der Fragende darüber im Klaren sein, was er will und dies richtig formulieren. Grundlegende Kenntnisse über das Thema erleichtern dies. Dieser Beitrag soll einen ersten Einstieg in das Thema liefern, grob aufzeigen, welche Intentionen und Methoden es gibt und dem Testwilligen die Fragenstellung und Kommunikation erleichtern.

Was kann man testen und wozu?

Übersicht-DNA
Übersicht DNA

Autosomale DNA:
Die meisten Tester gibt es bei den Tests für autosomalen DNA. Dementsprechend gibt es einige Firmen mit großen Nutzer-Datenbanken. AtDNA Tests werden sehr oft mit dem Herkunftsrechner beworben und sind dadurch Verkaufsschlager. Leider haben sie eben deswegen oft auch zu Unrecht einen schlechten Ruf, da in kritischen Artikeln oft kaum oder gar nicht auf die Stärken dieser Tests eingegangen wird.
Autosomale DNA kann für die Genealogie sehr Hilfreich sein, da man mit ihr, auch aufgrund der großen Nutzer-Datenbanken folgendes kann:

  • Verifizieren einzelner Vorfahrenlinien des Ahnenbaums,
  • Schließen von Lücken im Ahnenbaum, (z.B. feststellen, wer der Groß- oder Urgroßvater war)
  • Auffinden der biologischen Eltern,
  • Auffinden von entfernten Verwandten, welche Ausgewandert (oder eben nicht Ausgewandert) sind und mit ihnen Kontakt aufnehmen,

Mitochondriale DNA:
Mitochondriale DNA wird von der Mutter an Söhne und Töchter übergeben und erlaubt Rückschlüsse auf die Verwandtschaft der rein weiblichen Linie. Diese mutiert sehr langsam, so dass diese sogar nach vielen Generationen unverändert bleibt. Dadurch wird diese für die Genealogie nur in speziellen Fällen von Nutzen sein, was nicht bedeutet, dass sie nicht wertvolle Erkenntnisse liefern kann, insbesondere bei Migrationspfaden anhand von mt-Haplogruppen.

Y-DNA:
Dies ist der Kern dieses Berichts und soll hier die meiste Aufmerksamkeit bekommen. Nichtsdestotrotz will ich an einem kleinen Beispiel aufzeigen, wie wichtig es ist, sich erst einmal Gedanken zu machen, was man genau vor hat, sich eine Strategie zurecht legen und überlegen mit welchem Werkzeug (oder Werkzeugen) man am besten ans Ziel kommt. Indem man Strategie und Vorhaben kommuniziert, kann man wertvolle Tipps bekommen und diese optimieren.

Man ist schnell geneigt, alles was mit der väterlichen Linie zusammen hängt mit dem Werkzeug Y-DNA bearbeiten zu wollen, auch wenn es eine einfachere Möglichkeit gibt. Nehmen wir den vorher erwähnten Fall: „Schließen von Lücken im Ahnenbaum und den väterlichen Großvater finden.“ Dies mag per Y-DNA in gewissen Fällen wohl tatsächlich funktionieren, das bessere Werkzeug hierfür ist aber tatsächlich die atDNA, allein schon wegen der weitaus größeren Datenbank und der Möglichkeit den Großvater über Seitenlinien auf die Schliche zu kommen.

Wenn es aber darum geht, verwandtschaftliche Beziehungen auf rein väterlicher Linie, über mehrere Generationen hinweg zu verifizieren, ist Y-DNA Test die richtige Wahl. Mein eigenes Anliegen ist es eine Familienlegende zu verifizieren, welche besagt, dass mein väterlicher Vorfahr vor etwa dreihundert Jahren aus einer bestimmten Gegend Griechenlands kam. Hier kommt man mit atDNA nicht weiter. Die Auswahl an Tests für Y-DNA ist Umfangreich. Abhängig vom Beweggrund für solch einen Test gibt es unterschiedlich Herangehensweisen.

Y-DNA, Haplogruppe und Genealogie

Y-DNA, Haplogruppe und Genealogie
Y-DNA, Haplogruppe und Genealogie

Dieses Flussdiagramm gibt es hier zum Runterladen: Y-DNA, Haplogruppe und Genealogie.PDF

1.0  Nur Haplogruppe

Nicht jeder, der an einen Test für Y-DNA denkt, hat die Genealogie und seine direkten väterlichen Ahnen vor Augen. Einige interessieren sich aus unterschiedlichen Gründen, wie z.B. historische Migrationen, „nur“ für die Y-Haplogruppe. Bei den autosomalen DNA Tests von 23andme und Living DNA werden die Y-Haplogruppe und die mt-Haplogruppe direkt angezeigt. Was viele nicht wissen ist, dass bei allen autosomalen Tests Informationen in Form von SNPs (Single Nucleotide Polymorphism) für die Y-Haplogruppe mit ausgelesen werden und in den Rohdaten vorhanden sind. Lediglich bei FTDNA werden diese Informationen aus den Rohdaten entfernt. Mit einem Script, genannt Morley Predictor kann man diese Informationen auslesen.

Es wird gerne übersehen, dass nicht nur die Y-Haplogruppe, welche festgestellt wurde, von Bedeutung ist, sondern auch die Untergruppen, welche bereits als negativ mitgetestet wurden. Dies wird leider nicht direkt mit angezeigt. Wenn man eine „alte“ Haplogruppe angezeigt bekommt (23andme, Living DNA), obwohl jüngere Zweige mitgetestet werden, kann es bedeuten dass man auf einem seltenen Ast sitzt. Ein manuelles Überprüfen der Rohdaten ist ratsam.

Die unterschiedlichen Anbieter testen unterschiedlich viele Y-SNPs. Nichtsdestotrotz behaupte ich, dass die Ergebnisse in etwa auf fast dem gleichen niedrigen Level sind. Will man seine Y-Haplogruppe genauer wissen und herausfinden zu welcher Untergruppe man gehört, muss man zu einem sogenannten „Haplogroup panel“  oder einzelnen SNPs greifen. Dies geht am Einfachsten bei der Firma YSEQ aus Berlin, ohne dass man einen teuren Umweg über Y-STR (Short Tandem Repeat) gehen muss. Weiß man bereits seine grobe Haplogruppe, so kann man sich für wenig Geld am Y-Baum bis hin zu seiner jüngsten bekannten (terminalen) SNP hinab hangeln. Hat man vorher keinen atDNA-Test gemacht und interessiert sich nicht für deren Vorzüge, so kann man auch direkt das „Top Level Orientation Panel“ wählen, welches zum gleichen Ergebnis, einer per SNP verifizierten Haplogruppe, führt.

Was ist eine Y-Haplogruppe?
Eine Y-Haplogruppe ist eine Gruppe an Männern, welche einen gemeinsamen Vorfahren in väterlicher Linie teilen. Den jüngsten gemeinsamen Vorfahren nennt man im Englischen MRCA für „Most Recent Common Ancestor“ . Spricht man über die Zeit, wie weit zurück dieser gelebt hat, so spricht man von TMRCA für „Time to the Most Recent Common Ancestor“.

Bei einer einfachen Bestimmung der Y-Haplogruppe kann der TMRCA bei ungefähr 5000 Jahren oder auch weit drüber liegen und sogar wenn man auf Untergruppen verfeinert, kommt man unter Umständen nicht näher als 1000 Jahre an den MRCA ran. Wenn man sich mit Genealogie beschäftigt, kann es schon auch interessant sein, wie sich seine Y-Haplogruppe die letzten 2000 Jahre verteilt hat, das Hauptinteresse dürfte jedoch in den letzten Jahrhunderten liegen. Dafür bedarf es Methoden bei denen man die Mutationen der letzten Jahrhunderte betrachten kann.

Zusammenfassung Beweggründe für (1.0):

  • Ermitteln der Y-Haplogruppe für vor- und frühgeschichtliche Forschungen.
  • Mit diesen Tests kann man zwar nicht feststellen, dass zwei Männer in väterlichen Linie verwandt sind, man kann jedoch feststellen, dass zwei Männer *nicht* in väterlichen Linie verwandt sind, was auch oft hilfreich sein kann.
  • Aufgrund der großen Datenbanken und der damit verbundenen autosomalen Treffer (Matche) kann man dies auch gut zum „fischen“ nutzen, sprich Tester finden, welche für die eigenen Y-Forschungen von Belang sind und diese zu einem weiterführenden Test animieren.

2.0 Haplogruppe und Y-STR für Genealogie

Eine dieser Methoden, Y-STR (Short Tandem Repeat), ist schon etwas älter (relativ), aber immer noch gängige Praxis. Vor einigen Jahren gab es noch mehrere Firmen, welche auf Y-STR setzten, einschließlich AncestryDNA, zwischenzeitlich bieten nur noch wenige Firmen solche Y-STR-Panels an. Zwei nennenswerte Firmen sind FamilyTreeDNA (FTDNA) in Texas, Houston und YSEQ in Berlin, Deutschland. Will man einen Test für Y-DNA bei FTDNA machen, so kommt man nicht daran vorbei wenigstens ein Y-37 zu kaufen. (Kleinere Panels wie Y12 und Y25 kann man nur noch über Projektgruppen beziehen.) Das gleichwertige Produkt bei YSEQ nennt sich YSEQ-Alpha-Beta.

Die Grundsätzliche Frage, welche dieser beiden Firmen man für einen Y-STR-Test nehmen soll, ist nicht einfach zu beantworten. Die Panels von FTDNA sind teurer, aber dafür gibt es dort eine Nutzer-Datenbank und Projektgruppen, welche man sich anschließen kann. Ob man von der Datenbank profitiert, weiß man aber erst im Nachhinein. Man könnte hier zur Regel nehmen, dass die Wahrscheinlichkeit, von dieser Datenbank zu profitieren steigt, umso mehr Tester es aus Deiner Herkunftsregion gibt, es dürfte aber auch einige Ausnahmen geben, weswegen ich hier keine Empfehlung abgeben möchte.

Der klare Vorteil von Y-STR liegt darin, die Y-DNA zweier oder mehrerer Männer in einer Datenbank oder einer Tabelle vergleichen zu können, da Y-STR auch jüngere Mutationen beinhalten kann. Umso mehr Y-STR-Marker zur Verfügung stehen, desto genauere Aussagen kann man bezüglich dem Grad der Verwandtschaft treffen. Hat man beim Einstieg mit 37 Markern niemanden zum Vergleichen (kein Match), so ist es fraglich, ob mehrere Marker etwas bringen und ein Erweitern auf Y67 oder Y111 sinnvoll ist. Dies hängt von mehreren Faktoren und seinen eigenen Beweggründen ab.

Y-Haplogruppen werden über Y-SNP definiert und nach ihnen benannt. Man kann aber mehr oder weniger gut über Y-STR die Haplogruppe „vorbestimmen“. Eine solche Vorbestimmung wird bei FTDNA angezeigt und diese ist sehr konservativ, manchmal so primitiv, dass man sich fragt, warum man so viel Geld dafür ausgegeben hat. Das liegt eben daran, dass man die Y-Haplogruppe per Y-STR nur vorbestimmen kann, die Verifizierung jedoch über Y-SNP stattfindet. In Abhängigkeit von der Anzahl der Y-STR, der Haplogruppe und der Fähigkeit eines Experten für diese Haplogruppe (Haplogruppen-Administratoren) diese zu interpretieren, kann man damit sogar genauere Vorhersagen treffen, als man mit SNP-Packs verifizieren kann. Genauso kann es aber auch vorkommen, dass eine Vorbestimmung gar nicht eindeutig Möglich ist. Ein nützliches Werkzeug um die Haplogruppe selber aus den Y-STR vorbestimmen zu können ist der Nevgen Predictor.

In vielen Fällen ist es Erforderlich die vorbestimmte Haplogruppe per SNP zu verifizieren. Hier sollte man sich Gedanken machen, ob es sinnvoller ist ein SNP-Pack von FTDNA zu nehmen, oder auf ein Haplogroup panel von YSEQ zu gehen. Abhängig von der Haplogruppe gibt es erheblich Unterschiede in der Aktualität der Panels. Man kann diesen Schritt aber auch auslassen und sich für ein NGS entscheiden.

Zusammenfassung Beweggründe für (2.0):

  • Ermitteln der Y-Haplogruppe für vor- und frühgeschichtliche Forschungen. (Vorbestimmung per Y-STR, aber auch anschließendes Verifizieren per Y-SNP)
  • Feststellung und Bewertung der väterlichen Verwandtschaft zwischen zwei Männern per Y-STR. (Auch per Datenbank)

3.0 Komplette Y-DNA, inkl. Haplogruppe, Terminale-, Novel SNPs und Y-STR für Genealogie

Seitdem die Preise für NGS-Tests (Next Generation Sequencing) fallen, finden diese Tests immer mehr Anhänger. Für Y-DNA-Interessierte gibt es zweierlei Tests. Einmal die Y-basierten NGS wie den Big Y von FTDNA, welche nur den Y-Abschnitt des Genoms wiedergeben (Im Fall des YElite von FGC auch des mt-Abschnittes) und dann die WGS (Whole Genome Sequencing), welche das gesamte Genom beinhalten, inclusive der gesamten mitochondrialen und autosomalen DNA.

Der Vorteil dieser Tests ist, dass nicht nur bekannte SNPs getestet werden, sondern fast (abgesehen von sogenannten „nocalls“) der gesamte Abschnitt der Y-DNA mit über 23 Millionen Basenpaaren. Es werden fast alle SNPs gefunden, welche einen von der Referenz, dem Human Genome, unterscheiden. Das dürften knapp unter 3000 „positive“ SNPs sein. In speziellen Datenbanken, wie Yfull.com werden die Rohdaten analysiert und mit anderen Probanden verglichen. Varianten, welche man mit anderen teilt, bestimmen die Haplogruppe und die terminale SNPs. Varianten, welche zum ersten Mal bei einem Probanden gefunden wurden, nennt man „Novel“ SNPs oder auch „Private“ SNPs. Diese sind das größte „Kapital“ dieser NGS Tests, da man diese nur auf diese Weise, mit solch einem Test ermitteln kann. Das sind sozusagen die Y-SNPs, welche die letzten Jahrhunderte mutiert sind und jene, welche die größte Relevanz für die Genealogie haben. Lädt ein weiterer Proband, seine Rohdaten zur selben Datenbank hoch, welcher auch positiv für einen Teil dieser Y-SNPs ist, so wird eine neue Untergruppe im Y-Baum gebildet. Die „Novel Variants“ werden unter anderem auch verwendet um den TMRCA einer Untergruppe zu bestimmen. Zusätzlich lassen sich aus NGS Tests mehrere hundert Y-STR (bei Yfull bis zu 780) extrahieren und deren Vorteile nutzen.

Der Big Y von FamilyTreeDNA (FTDNA) erfreut sich trotz seinem verhältnismäßig hohen Preises einer großen Beliebtheit, da man vorhandene Tests, wie den Y37 erweitern kann, ohne erneut eine Probe einzusenden. Zusätzlich verfügt FTDNA über eine große Datenbank für Big-Y einem eigenen Y-Baum und bietet einige kleine Werkzeuge zum Interpretieren der Ergebnisse. Leider kann man diesen Test nur in Kombination mit dem Y111 und nicht separat kaufen. Der YElite von FGC bietet eine gute Abdeckung der Y-DNA und beinhaltet zusätzlich die mt-DNA.

WGS werden von unterschiedlichen Firmen angeboten. Diese beinhalten neben der Y-DNA noch die gesamte mitochondriale und autosomale DNA. Firmen wie Full Genome Corporation (FGC) und YSEQ haben sich auf die genealogische Verwendung von WGS-Rohdaten spezialisiert und bereiten diese dementsprechend auf, so dass ich diese Firmen für Leute empfehlen möchte, welche selber nicht in der Lage sind, diese Schritte zu erledigen. Wenn man sich das selber zutraut kann man aber auch jede andere Firma wählen, welche WGS anbietet, vorausgesetzt man bekommt die Rohdaten in den Formaten FASTQ oder BAM.

Unabhängig davon, bei welchem Anbieter man seinen NGS gemacht hat empfehle ich die Analyse bei Yfull.com. Diese bietet so viele Vorteile, dass es mehrere eigenständige Beiträge bedarf um diese darzustellen. Hier ein aktueller Blogbeitrag mit den wichtigsten Vorteilen von Linda Jonas (Englisch): Advantages of submitting to Yfull

Einen Vergleich der Unterschiedlichen NGS bezüglich Abdeckung und deren Bedeutung für die Altersbestimmung findet man hier: ydna-warehouse.org/statistics

Zusammenfassung Beweggründe für (3.0):

  • Alle positive SNPs werden ermitteln, inclusive der „privaten“ Varianten, welche vorher bei noch keinem anderen Probanden positiv getestet wurden.
  • Extrahieren von mehreren hunderten Y-STR.
  • Feststellung und Bewertung der väterlichen Verwandtschaft zwischen zwei Männern per Y-SNP, Y-STR und privaten SNPs.
  • Aktives Mitwirken beim „wachsen“ der Y-Bäume, wie das Formen neuer Zweige.
  • Ermitteln der Y-Haplogruppe und Untergruppe für vor- und frühgeschichtliche Forschungen, aber auch Migrationsbewegungen der letzten Jahrhunderte.
  • Hochladen der Rohdaten zu Yfull.com.
  • Automatische Aktualisierung der terminalen SNP durch Hinzufügen neuer Probanden zu den Datenbanken.
  • „private Varianten“ und junge terminale SNP zum Verifizieren von väterlichen Beziehungen,  wie in Punkt 4.0 beschrieben.

4.0 Verifiziere Y-Beziehung, mit Hilfe von bekannter terminaler SNP und privaten SNPs von einem NGS

Wollte man die Y-DNA zweier Männer vergleichen, griff man bisher zu Y-STR Tests mit möglichst vielen Markern. Hat man einen NGS zur Verfügung, so bietet sich eine neue Methode, wie man die Beziehung zweier Männer anhand von „jungen“ SNPs bestimmen kann. Diese Variante funktioniert jedoch nur, wenn die Anzahl der privaten SNPs, bzw. der terminalen SNPs nicht zu hoch ist, da mit zunehmender Anzahl der zu testenden SNPs die Kosten hierfür steigen. Möglich wird dies durch die Firma YSEQ.net und der Möglichkeit jede SNP, welche mit dem Sanger Verfahren Testfähig ist, für wenig Geld auch tatsächlich testen zu können.

Erst überprüft man ob die Varianten, welche man testen will, bereits bestellbar sind. Mit „Wish a SNP“ teilt man YSEQ mit, welche SNPs in das Sortiment aufgenommen werden sollen. Dabei muss man nur berücksichtigen, dass diese in den testfähigen Bereichen liegen. Man verifiziert erst per Test der terminalen SNP, dass tatsächlich eine väterliche Verwandtschaft besteht. Besteht diese, so testet man bei diesem Probanden alle vorhandenen Privaten Varianten. Von diesen sollten dann einige Positiv und andere Negativ sein. Anhand der jeweiligen Anzahl kann man die Verwandtschaft bewerten.

5 Kommentare zu „Y-DNA, Haplogruppe und Genealogie“

  1. Pingback: Nimm Teil am Y-Baum! – ΑΝΤΩΝΙΟΣ ΔΝΑ PROJECT

  2. Pingback: Y-Haplogruppe aus atDNA Rohdaten – ΑΝΤΩΝΙΟΣ ΔΝΑ PROJECT

  3. Hallo Antonio,
    quasi seit Jahren bin ich neugieriger Mitleser Deiner Y-DNA Recherche erst auf FB (DNA Genealogie auf deutsch), dann hier im Blog, habe ich nun letztes Jahr bei einer “Sales Aktion” eine WGS-Test bei dante labs gekauft. Nun, bald 5 Monate später sind die Daten verfügbar. Ich würde gerne alle Schritte selber machen möchte, auch die Aufbereitung. Leider geht es schon damit los, dass ich nicht genau weiß was ich runter laden soll (BAM (BA), BAM, FASTQ etc.). Ich dachte ich die Schritte hätte ich schon mal in Deinem Blog gelesen, finde sie aber nicht mehr. Kannst Du mir einen Link/Tipp etc geben…
    Viele Grüße Uwe

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert