Zentrum für Humangenetik und Laboratoriumsmedizin, Dr. Klein, Dr. Rost und Kollegen

Next Generation Sequencing (NGS)

Die Einführung der Next Generation Sequencing (NGS)-Technologien hat die Etablierung bedeutender, neuer diagnostischer Anwendungen in der täglichen Routine ermöglicht. Obwohl der Einsatz der NGS-Technologie in der klinischen Diagnostik mit Herausforderungen verbunden ist, wird die Umstellung aufgrund der sich bietenden Vorteile dennoch unumgänglich sein. Neben der extrem hohen Sequenzierkapazität ermöglicht NGS die klonale Sequenzierung einzelner Moleküle, eine höhere diagnostische Sensitivität durch parallele Sequenzierung von ganzen Genpanels, vereinfachte Handhabung sowie die parallele und dadurch kostengünstigere Bearbeitung der Proben. Neueste technische Fortschritte haben NGS zu einer verlässlichen Alternative für die klassische Sanger-Sequenzierung entwickelt.

Roche 454

Roche 454 Life Sciences war 2005 mit der Vorstellung des GS 20 Sequenziergeräts das erste Unternehmen, das eine Next Generation Sequencing Plattform kommerziell angeboten hat. Die Roche 454 Sequenziersysteme benutzen emulsions-PCR (emPCR) für die klonale Amplifikation der Proben, gefolgt von hochparallelem Pyrosequencing. Während der emPCR wird die zu sequenzierende DNA an spezifische Beads gebunden und klonal amplifiziert. DNA tragende Beads werden dann angereichert und in spezielle Reaktionskammern auf so genannten Pico Titre Plates (PTP) befördert. Diese Reaktionskammern enthalten alle für die Sequenzierung nötigen Reagenzien.

Anschließend wird sequentiell je eine Art von fluoreszenzmarkierten Desoxyribonucleotiden (dATP, dTTP, dCTP, dGTP) in definierter Reihenfolge zugegeben. Ist ein Nukleotid komplementär zu der Base im DNA-Template, erfolgt ein Einbau und ein Lichtsignal wird emittiert. Sind in der zu sequenzierenden DNA mehrere aufeinanderfolgende, identische Nukleotide vorhanden (Homopolymere) werden mehrere gleiche Nukleotide hintereinander eingebaut und das korrespondierende Lichtsignal ist proportional stärker.

Auf dieser Technologie basieren der Roche GS FLX Titanium Sequencer, der GS FLX+, eine verbesserte Version, die längere Leseweiten ermöglicht und die Benchtop Version, der Roche 454 Junior. Mit dem GS FLX und Junior Geräten können durchschnittliche Leseweiten von 450-550 bp erreicht werden, während mit dem FLX+ Upgrade die Leseweiten auf 750-850 bp gesteigert werden können. Mit diesen Geräten kann ein Durchsatz von 350-700 Mb pro 10 Stunden Lauf auf den GS FLX Systemen und 30-50 Mb pro 8 Stunden Lauf auf dem GS Junior Gerät erreicht werden.

Roche 454 Sequencing: (a) Genomische DNA, (b) Fragmentierung und Adapter Ligation, (c) emPCR I, DNA Fragment gebunden an Bead, (d) emPCRII, klonal amplifizierte Fragmente gebunden an Bead, (e) Beads in den Reaktionskammern der PTP Platte, (f) emittierte Lichtsignale. (Mit freundlicher Genehmigung von Roche Diagnostics GmbH, Mannheim, Deutschland)


Illumina SBS

Die Illumina sequencing-by-synthesis (SBS)-Methode wurde 2006 unter der Solexa eingeführt. Bei dieser Methode wird die fragmentierte Template-DNA über spezifische Adaptoren kovalent an einen Glasobjektträger (FlowCell) gebunden, auf der die Sequenzierreaktion stattfindet. Von dem gebundenen Startmolekül ausgehend werden durch einen PCR-ähnlichen Schritt Cluster aus identischen Molekülen gebildet (Bridge-amplification). Die Sequenzierung erfolgt zyklusweise und nutzt reversible Terminatorchemie und fluoreszenzmarkierte Nukleotide. In jedem Sequenzierzyklus wird genau ein Nukleotid komplementär zu der Template-DNA eingebaut. Anschließend wird die Fluoreszenzgruppe abgespalten, das folgende Lichtsignal detektiert und die Terminatorgruppe entfernt, so dass ein weiteres Nukleotid im folgenden Zyklus eingebaut werden kann. Ein besonderes Merkmal der Illumina SBS-Methode ist die Möglichkeit, eine sogenannte paired-end-Sequenzierung durchzuführen. Hierbei werden die zu sequenzierenden DNA-Fragmente von jeder Seite mit einer vorher festgelegten Leseweite von 100-250 bp sequenziert. Je nach Größe der DNA-Fragmente können diese Reads überlappen oder durch einen nicht-sequenzierten DNA-Teil (Insert) getrennt sein. Die Paired-end-Sequenzierung bietet viele Vorteile bei der bioinformatischen Auswertung und kann die Genauigkeit der Analysen signifikant erhöhen.

Es gibt mehrere Sequenzierinstrumente, die diese Methode verwenden, der Genome Analyzer IIx (GAIIx), die Nachfolgemodelle der HiSeq-Serie (HiSeq1000, HiSeq2000, HiSeq1500, HiSeq2500) und der MiSeq im Benchtop-Format. Die Durchsatzrate der Geräte reicht von 60-95 Gb (GAIIx) bis zu 600 Gb bei den HiSeq2000- und HiSeq2500-Geräten. Die Laufzeit beträgt hierbei 10 Tage für Leseweiten von 2x100 oder 2x150 bp. In einem speziellen „Rapid-run“-Modus können auf dem HiSeq2500 auch 120 Gb an Sequenz in 40 Stunden erzeugt werden. Der MiSeq bietet im Gegensatz dazu einen Durchsatz von 4-8 Gb, bei einer Laufzeit von 27-40 Stunden und Leseweiten von bis zu 2x250 bp.

Schematischer Ablauf der SBS-Methode: Einbau eines komplementären, fluoreszenzmarkierten Nukleotids, Detektion des Lichtsignals, Abspaltung der Terminatorgruppe und zyklusbasierte Sequenzierung (Mit freundlicher Genehmigung von Ilumina Inc., San Diego, CA, U.S.A.)


Life Technologies SOLiD

Die SOLiD-Technologie von Applied Biosystems, jetzt Life Technologies, 2008 erstmals vorgestellt, basiert wie auch die Roche 454-Sequenzierung auf klonaler Amplifikation der Template DNA durch emPCR. Die eigentliche Sequenzierung wird dann bei SOLiD durch „Sequenzierung-durch-Ligation" realisiert, d.h. die DNA-tragenden Beads werden auf die Oberfläche eines speziellen Glasobjektträgers aufgebracht und unter Verwendung von Primern passende Fluoreszenz-Farbstoff-gekoppelte 8-mer-Oligonukleotide an die DNA ligiert. Eine Besonderheit der SOLiD-Sequenzierung ist der sogenannte Colorspace, d.h. die sequenzierte Base wird nicht direkt detektiert, sondern über einen Farbcode gespeichert. Über zwei der 8 Basen in den ligierten Fragmenten ist eine Farbe definiert, das bedeutet, der Farbcode ist redundant und wird nachträglich in die richtige Nukleotidabfolge übersetzt. Da das Protokoll mehrere Zyklen mit verschiedenen Primern vorsieht, die jeweils um eine Base verschoben sind, wird jedes Nukleotid der Ausgangs-DNA zweimal gelesen. Im so genannten Color-Code kann damit unter Verwendung von vier Farben und 16 möglichen Kombinationen eindeutig die genomische Sequenz bestimmt werden. Die Tatsache, dass jede Base zweimal sequenziert wird (je einmal als erste und einmal als zweite Base des Farbpaares) kann bioinformatisch in der Auswertung ausgenutzt werden, um Sequenzierfehler von echten Varianten unterscheiden zu können.

Der Durchsatz des SOLiD-Systems erreicht 180 Gb pro 10-Tage-Lauf, die Leseweiten der „Mate-pair Sequenzierung“ beträgt 50-75+35bp.

SOLiD Sequenzierung durch Ligation von spezifischen 8-mer Oligonukleotiden und SOLiD Farbkodierung (Colorspace).


Ion Torrent PGM

Anfang 2010 wurde eine neue Sequenziertechnik, basierend auf Halbleitertechnologie von Ion Torrent Inc. vorgestellt. Diese Technik, die inzwischen von Life Technologies vermarktet und angeboten wird, wird auch als pH-vermittelnde Sequenzierung oder „Post-Light“-Sequenzierung bezeichnet. Die Methode folgt einem Sequenzierung-durch-Synthese-Ansatz insofern, dass ein DNA-Template durch sequentiellen Nukleotideinbau komplementiert wird. Die Methode zur Detektion der eingebauten Nukleotide unterscheidet sich allerdings substantiell von den vorher beschriebenen Methoden durch den Verzicht auf ein optisches Signal. Der Einbau eines Nukleotids involviert das Formen einer kovalenten Bindung unter Freisetzung eines Pyrophosphats und eines positiv geladenen Wasserstoffions. Der Einbau eines Nukleotids durch die DNA-Polymerase wird bei dem Ion Torrent-System durch eine Änderung des pH-Wertes, ausgelöst von dem freigesetzten Wasserstoffion, detektiert. Die zu sequenzierende DNA wird in Mikroreaktionskammern auf einem Halbleiterchip gebracht. Diese Reaktionskammern enthalten die DNA Polymerase, die verschiedenen Nuleotide werden sequentiell zugesetzt. Komplementäre Nukleotide werden von der Polymerase eingebaut und die freigesetzten Wasserstoffionen werden von einer ionensensitiven Schicht unter den Reaktionskammern detektiert. Wie bei der Roche 454 Technologie kann es zum Einbau von multiplen Nukleotiden in den Template-Strang kommen, falls eine Homopolymer-Region vorliegt. Auch hier ist das detektierte pH-Signal proportional zur Anzahl der eingebauten Nukleotide.

Die Sequenzierung eines Halbleiterchips dauert 2-4 Stunden, die Leseweite beträgt je nach eingesetztem Kit durchschnittlich 100, 200 oder 300 bp. Es werden verschiedene Chip Größen angeboten, die einen flexiblen Durchsatz ermöglichen: bis 10 Mb mit dem 314 Chip, bis 100 Mb mit dem 316 Chip und bis zu 1 GB mit dem 318 Chip.

Halbleiterchip 314 und schematischer Aufbau mit Mikroreaktionskammer-Schicht, Ionensensitiver Schicht und pH-Wert Sensor zur Signaldetektion.


Anreicherungsverfahren

Da der von den Sequenziergeräten generierte Datendurchsatz enorm und in den meisten Projekten nicht der limitierende Faktor ist, werden genomische DNA-Proben meist ohne weitere Vorbehandlung direkt für die Sequenzierung vorbereitet. In Anwendungen wie der gezielten Resequenzierung von spezifischen Genen oder Gen-Panels, die zum Beispiel zu der selben Krankheitsindikation gehören, wird jedoch keine Sequenzierung von Gesamtgenomen benötigt. Deshalb wurden verschiedene Technologien zur spezifischen Anreicherung von Zielregionen entwickelt (Target Enrichment). Unterschiedliche PCR- oder hybridisierungsbasierte Ansätze sind möglich. Die Kombination dieser Methode mit NGS kann die Analyse von krankheitsrelevanten Gen-Sets in der molekulargenetischen Diagnostik durch Verringerung von Zeit und Kosten verbessern. Unter Ausnutzung des enormen Durchsatzes der Geräte können mehrere Gene und Proben gemeinsam in einem Lauf analysiert werden.

Anwendungen

Der Einsatz von NGS in der molekulargenetischen Diagnostik scheint erfolgversprechend. Fortschritte und Verbesserungen in den Protokollen sowie in den Sequenzier- und Anreicherungs-Technologien werden es in Zukunft erleichtern, klinische Fragestellungen wie mentale Retardierung, hereditäre Herzmuskel- oder Bindegewebserkrankungen, molekular-pathologisches Grading, Infektionserregerspektrum oder HLA-Kompatibilität von Transplantaten schneller und umfangreicher zu bearbeiten. Es ist denkbar, dass die bisher durchgeführte Stufendiagnostik zusammengefasst und in einem Ansatz durchgeführt wird. Im Bereich der Immungenetik wäre es möglich, alle codierenden Regionen des HLA-Locus in einem Ansatz zu sequenzieren und somit eine bessere Auflösung mit Haplotypinformation zu erhalten. Die Analyse des kompletten MHC-Locus würde darüber hinaus auch Informationen über immunmodifizierende Moleküle (wie z. B. Interleukine) liefern, die möglicherweise eine Rolle bei der Entwicklung einer Graft-versus-Host-Erkrankung bzw. Transplantatabstoßung spielen. Weiterhin könnten Spender-Empfänger-Differenzen ausfindig gemacht werden, die zur Verstärkung des Graft-versus-Leukemia Effektes beitragen. Detailliertere Information über die genetische Variabilität des MHC könnte die Spenderauswahl optimieren und damit zu besseren Transplantationsergebnissen beitragen.

Der Nachweis von Minoritäten ist insbesondere in der Leukämie-Diagnostik, aber auch bei soliden Tumoren oder komplizierten Erregerspektren wichtig. Gerade in der Tumordiagnostik trifft man häufig auf Mosaike, schwer zugängliches oder limitiertes Material wie Biopsien, oder Therapieverläufe, bei denen eine minimale Resterkrankung nachgewiesen werden soll. Durch eine entsprechend hohe Sequenziertiefe kann mit NGS hier häufig noch eine Aussage bezüglich Punktmutationen, Deletionen, Amplifikationen, Insertionen oder Genumlagerungen getroffen werden, auch wenn der Anteil von Zellen mit Wildtyp relativ hoch ist. Manchmal ist selbst eine Alleldiskriminierung möglich, wodurch unterschiedliche Tumorklone voneinander abgegrenzt werden können. Die möglichen Anwendungen gehen noch weit über die erwähnten Beispiele hinaus.

Molekulare Karyotypisierung

Die erfolgreiche Einführung chromosomaler Microarray-Analysen zur Identifizierung submikroskopischer Strukturaberrationen im Bereich der Routinediagnostik auf der einen Seite und Verbesserungen NGS-basierter Methoden („paired-end“-Ansatz) wird in absehbarer Zukunft zu einer Verschmelzung von molekular- und zytogenetischer Diagnostik führen. Hoch auflösende Microarray-Plattformen wie der CytoScan HD von Affymetrix erlauben bereits heute den Nachweis chromosomaler Imbalancen im Bereich weniger Kilobasenpaare. Der Einsatz von NGS-Techniken wird in Zukunft nicht nur die noch vorhandene Lücke bis zum Niveau der einzelnen Nukleotidveränderung schließen, sondern auch eine exakte Bruchpunktbestimmung balancierter Chromosomenveränderungen ermöglichen.

Nicht-Invasiver Pränataltest (NIPT)

Die Entdeckung zellfreier, fetaler DNA (cell free fetal DNA, cffDNA) im mütterlichen Blut eröffnet die Möglichkeit, mittels NGS-basierter Techniken pränatal Aussagen über bestimmte Aneuploidien zu treffen. Aus einer Blutprobe der werdenden Mutter werden maternale und fetale DNA (Anteil >10%) extrahiert und anschließend sequenziert. Durch Quantifizierung der NGS-Sequenzen inklusive einer statistischen Analyse kann festgestellt werden, ob beim Feten mit hoher Wahrscheinlichkeit eine Trisomie für Chromosom 21 (Down-Syndrom), 18 (Edwards-Syndrom) oder 13 (Pätau-Syndrom) vorliegt. Durch diese nicht-invasive Untersuchung können invasive Techniken, wie die Amnionzentese oder die Chorionzottenbiopsie, vermieden werden.

HLA Typisierung

Neueste technische Fortschritte haben NGS zu einer verlässlichen Alternative für die klassische Sanger-Sequenzierung zur Typisierung von HLA-Merkmalen werden lassen.

Die NGS-Technologie bietet den Vorteil der klonalen Amplifikation einzelner DNA-Moleküle, wodurch Ambiguitäten in den Typisierungsergebnissen vermieden werden können. Darüber hinaus  können  DNA-Moleküle mit sogenannten MID (multiplex identifiers)-Sequenzen markiert und so eindeutig einer bestimmten Probe zugeordnet werden, so dass die parallele Bearbeitung und Sequenzierung vieler Proben gleichzeitig möglich ist. Durch einen höheren Probendurchsatz können Arbeitszeit und Kosten deutlich reduziert werden. Zur Zeit wird die Typisierung der neu registrierten Blutstammzellspender mit der NGS-Technologie durchgeführt. Es werden Exon 2 und 3 der HLA-A, -B, -C, -DRB1 und DQB1-Merkmale mit dem GS FLX Titanium Sequencer von Roche 454 sequenziert. Für die Anreicherung dieser Genabschnitte (Library Preparation) wird die Amplicon-Strategie verfolgt; die dazu notwendigen PCR-Primer wurden hausintern entwickelt. Um einen hohen Probendurchsatz zu erreichen, wurden möglichst viele Arbeitsschritte automatisiert. Die PCRs werden im 384-well Plattenformat von einem PCR-Automaten (STARlet, Hamilton) pipettiert. Auch die Aufreinigung der PCR-Produkte und die Anreicherung der Emulsion-PCR-Beads sind auf zwei weiteren Pipettierrobotern automatisiert worden. Je nach Fragestellung können zwischen 95 und 380 Proben in einem GS FLX-Lauf sequenziert werden. Die Auswertung der Rohdaten erfolgt mit der Sequence Pilot-Software (JSI medical systems), die einen kontinuierlichen Sequenzabgleich mit der wichtigsten HLA-Datenbank (IMGT/HLA Database) ermöglicht.

Die Automatisierung von Workflows bringt Zeitersparnis, Pipettiergenauigkeit und Sicherheit vor Probenverwechslungen. Bei uns sind Geräte von Hamilton (USA, Schweiz) und Tecan (Schweiz) im Einsatz.