WGS400 – Das neue Whole Genome NGS von YSEQ speziell für Genealogieforscher mit 400 Base Long Reads

Mitte Februar 2021 stellte die Firma YSEQ aus Berlin ihr neues Produkt, das WGS400 vor. Ich habe mich sehr darüber gefreut, da ich mit der Firma YSEQ in den letzten Jahren schon sehr gute Erfahrungen gemacht habe und diese für mich einige Vorteile gegenüber anderen Firmen bietet. Mit dem WGS400 bieten sie nun auch ein NGS (Next Generation Sequencing) an, das nicht nur qualitativ hochwertig ist, sondern auch preislich konkurrenzfähig und alles beinhaltet, was mir als DNA-Genealogieforscher wichtig ist.

Vorteile der Firma YSEQ:

  • Niedrige Versandkosten und kurze Versandzeiten, da Firma und Labor in Berlin, Deutschland.
  • Probe wird für Erweiterungen eingelagert.
  • Kaufe ein leeres DNA Sample Kit und bestelle das Produkt Deiner Wahl, sobald das Kit im Labor eingetroffen ist.
  • Große und flexible Produktpalette: Y-DNA (Y-STR-Panels, Single-STR, SNP-Packs, Single-SNPs, Benutzerdefinierte Panels), mtDNA (HVR1, HVR2, full sequence), Whole Genome Sequencing.
  • Nahezu jede SNP bestellbar „Wish a SNP“, sowie das Erstellen von  benutzerdefinierte Panels.
  • Gelebter Kundenservice

Vorteile des WGS400:

  • Es kann eine vorhandene, bei YSEQ eingelagerte Probe zum Erweitern auf WGS400 verwendet werden.
  • Niedriger Preis
  • Kaufe ein leeres DNA Sample Kit, überprüfe mit einer Single-SNP ob der Tester zur richtigen Y-Haplogruppe gehört und erweitere den Test erst danach auf WGS400. (Das ist für mich der wichtigste Punkt)
  • Kostenlose BAM Datei (Rohdaten), im für Y-Genealogen passenden Format hg38. (Keine Konvertierung für YFull von hg19 auf hg38 nötig)
  • Rohdaten (BAM) beinhalten die gesamte Y-DNA, die gesamte mt-DNA und autosomale DNA.
  • FASTA Datei für mt-DNA (Rohdatendatei für mt-DNA)
  • 400-Base long reads (Vorteile werden von YSEQ im nachfolgenden Anhang beschrieben)
  • Es können mehr STR Marker ausgelesen werden.
  • Sehr gute Längen- und Tiefen- Abdeckung (SNPs)
  • Direkter Zugang zum Übertragen der NGS Daten (Y-, mt-DNA) an die YFull.com Datenbank.

Anhang:

Hier folgt der maschinell übersetzte Werbetext von YSEQ für das Produkt WGS400 (link):

Dies ist das neue Whole Genome NGS von YSEQ speziell für Genealogieforscher mit 400 Base Long Reads

Das ganze Genom enthält über 200 Mal so viele Daten wie das Y-Chromosom allein! Die Sequenzierung hat sich in den letzten sieben Jahren dramatisch verbessert, so dass es nicht sehr sinnvoll ist, einen hohen Preis für eine Art von Sequenz zu zahlen, die nur 70% des Y-Chromosoms abdeckt. Zu einem wesentlich niedrigeren Preis pro Base können Sie mit dem Whole Genome Test von YSEQ fast 100% des Y-Chromosoms erhalten.

Sie werden in der Lage sein, eine vollständige und genaue Sequenz des Y-Chromosoms, der mitochondrialen DNA, sowie aller anderen Chromosomen von 1 bis 22 und natürlich des X-Chromosoms zu erhalten.

Warum sind 400-Base-Reads wichtig?

Die Genomsequenz, die Sie von den meisten anderen Unternehmen erhalten, besteht aus sehr kurzen einzelnen Reads von jeweils 100 oder 150 Basen. Dies schränkt die Aussagekraft der Daten stark ein. Viele wichtige Arten von Variationen im Genom können mit diesen kurzen Reads nicht erfasst werden – Deletionen, Insertionen, Inversionen und andere komplexe Umlagerungen Ihres Genoms, die eine viel größere Auswirkung haben können als einfache Ein-Basen-Veränderungen (SNPs). Ganz zu schweigen davon, dass viele STRs mit solch kurzen Reads nicht gelesen werden können. Im Folgenden geben wir ein Beispiel dafür, wie lange Reads uns die Möglichkeit geben, STRs zu lesen, die sonst nicht erkannt werden.

Die größte Verbesserung der Long-Read-Sequenzen ist, dass sie es uns ermöglichen, de novo Assemblies zu erstellen. Das heißt, anstatt sich auf eine Standard-Referenzsequenz zu verlassen, können wir die echte, einzigartige Y-Chromosom-Sequenz entschlüsseln, wie sie in jeder Haplogruppe gefunden wird.

Beispiel Daten

In unseren Testläufen vor der Markteinführung von WGS400 haben wir einige erstaunliche Sequenzierdaten gesammelt, die die neuen Möglichkeiten zeigen

FTP Link: https://genomes.yseq.net/WGS/400SE/

Wir haben unabhängige Experten gebeten, einen Blick auf die Daten zu werfen und präsentieren hier ihre Ergebnisse:

Analyse durch YFull eines FGC WGS (links) und YSEQ WGS400 (rechts) der selben Person.
Analyse mit dem online tool bam.bioio.io


400-Basen-Reads verbessern die Lesbarkeit von Y-STR-Markern

Normalerweise werden WGS-Tests mit 2 x 100 Base oder 2 x 150 Base Paired End Reads durchgeführt. Dies ist gut genug, wenn Sie nur kurze SNP-Marker untersuchen wollen, aber längere sich wiederholende Elemente, wie STR-Marker, können mit kurzen Reads nicht abgedeckt werden.

Zum Beispiel ist der Y-STR-Marker DYS684 (auch bekannt als DYS1005) etwa 250 Basen lang und sieht wie folgt aus:

Verschiedene Personen können eine unterschiedliche Anzahl von CTTT- oder CCTTT-Wiederholungseinheiten haben. Offensichtlich können 150-Basen-Reads an verschiedenen Positionen auf dieser Sequenz abgebildet werden, und die Enden können nicht gleichzeitig an beiden Seiten des Wiederholungsabschnitts verankert werden. Auf diese Weise ist es unmöglich, die korrekte Wiederholungszahl zu identifizieren und andere Personen zu finden, die mit Ihnen an dieser Markierung übereinstimmen. 400-Basen-Reads können die gesamte Strecke der langen STR-Marker abdecken, und mit dieser Technologie können wir fast jeden STR-Marker auflösen, der in den bestehenden Y-STR-Datenbanken getestet wurde.


Mehr STR Beispiele

Lange STR-Marker können nicht mit 150-Basen-Paired-End-Reads abgedeckt werden, aber 400-Basen-Single-Reads können über beide Enden des Repeat-Abschnitts reichen. Deshalb sind längere Reads für die Messung von STR-Markern wichtig.

YFull STR Details.
Lange STRs mit vielen Wiederholungen werden durch einen WGS400 deutlich besser abgedeckt.

1 Kommentar zu „WGS400 – Das neue Whole Genome NGS von YSEQ speziell für Genealogieforscher mit 400 Base Long Reads“

  1. Sven Heerbach

    Hallo Antonio, auch ich habe dies mit großer Freude gesehen und gleich erstmal einen NGS für meinen Bruder bestellt. Einfach um nochmal alle SNPs zu prüfen. Als ich damals mit den Tests bei FTDNA begonnen habe, hatten meine ersten beiden Tests (darunter mein eigener!) nur eine Length Coverage von 50-51 %. Erst durch den Test meines Vaters wurde der Vorhang zu etlichen SNPs gelüftet, die vorher im Verborgenen lagen.
    Außerdem ist es mir gelungen, einen Herbach aus Würzburg mit Wurzeln in Langenprozelten am Main zu einem Test bei YSEQ zu bewegen. Auf das Ergebnis warte ich mit größter Spannung, könnte es doch meine Theorie bestätigen, daß auch meine Familie aus Unterfranken stammt. Unser Name könnte seinen Ursprung in Harrbach am Main haben. Allerdings gibt es auch Herbachs in Werbach an der Tauber, was auch in der Nähe von Würzburg ist. Mein nächstes Projekt wäre eine Triangulation der Herbachs aus Langenprozelten und Herrbachs aus Gemünden (ziemlich sicher relativ nah verwandt) mit denen aus Werbach und einer weiteren Familie Herbach aus Wertheim am Main. Da muß ich aber noch viel Überzeugungsarbeit leisten…
    Deine Arbeit hat mich auf jeden Fall inspiriert und motiviert!
    Viele Grüße
    Sven

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.