DNA je anglická zkratka pro deoxyribonukleovou kyselinu, což je molekula obsahující genetickou informaci, která je základem pro stavbu a fungování živých organismů. Tato molekula se skládá ze čtyř typů stavebních jednotek, tzv. nukleotidů (adenin, thymin, cytosin a guanin, označované jejich prvním písmenem A, T, C a G). Každá molekula DNA typicky obsahuje tisíce až miliony nukleotidů a u každého druhu je jejich pořadí jiné. Sekvenování DNA pak znamená čtení pořadí (sekvence) jejích stavebních jednotek, nukleotidů. Během posledních padesáti let vědci vyvinuli několik metod pro sekvenování DNA.
Pokud to vezmeme z historického hlediska, můžeme je rozdělit do tří generací, které se liší jak dobou vzniku, tak schopností číst krátké či dlouhé sekvence. První generace zahrnuje dvě metody, z nichž dodnes zůstává v používání Sangerovo sekvenování, schopné číst sekvence o délce až 1000 nukleotidů. Pro druhou generaci je charakteristické masivní paralelní sekvenování, což znamená, že miliony DNA sekvencí jsou čteny naráz. Hlavní zástupce je metoda Illumina, která umožňuje sekvenování kratších fragmentů (do 200 nukleotidů). Díky paralelizaci ale dosahujeme mnohem vyšší efektivity. Třetí generace přináší možnost číst jednotlivé molekuly a zároveň opravdu dlouhé úseky (stovky tisíc až miliony nukleotidů). Klíčovými technologiemi jsou SMRT a nanopórové sekvenování.
Metody první generace
Na konci 70. let 20. století byly vyvinuty dvě konkurenční metody sekvenování. První metoda využívá chemické degradace, při které se DNA na jednom konci radioaktivně označí a poté se štěpí pomocí chemického činidla. Vznikají úseky DNA různé délky, jejichž vzájemným porovnáváním se odečte sekvence. Tato metoda se ale hlavně kvůli použití radioaktivity, vysoké pracnosti a nízké efektivitě neujala [1]. Druhá metoda, tzv. Sangerovo sekvenování, využívá amplifikace (namnožení) DNA. Během kopírování jednoho DNA řetězce do druhého se do reakce přidá malé množství tzv. dideoxynukleotidů, speciálně upravených nukleotidů, které zastavují prodlužování řetězce. Zároveň jsou tyto dideoxynukleotidy označeny svítící značkou. Výsledkem je směs svítících DNA fragmentů různé délky končících na specifických nukleotidech. Díky množení DNA a použití svítících barviček přilepených na daný dideoxynukleotid má tato metoda mnohem vyšší citlivost a umožňuje čtení sekvencí o délce kolem 1000 nukleotidů [2].
V obou metodách vznikají molekuly, které se liší v délce o jediný nukleotid a my je musíme od sebe odlišit, abychom mohli přečíst sekvenci naší DNA. K tomu nám slouží metoda zvaná elektroforéza, která odděluje DNA fragmenty podle velikosti pomocí elektrického napětí a speciálního gelu fungujícího jako molekulární síto. Na jeden konec gelu aplikujeme DNA a pustíme skrz něj elektrické napětí, DNA putuje na druhý konec gelu a při tom se dělí podle své velikosti (představte si, že by skupina lidí šla hustým lesem – větší lidé budou mít větší problémy jím projít, a tedy se budou zpožďovat) [3]. K samotnému přečtení sekvence (tedy „písmenek DNA“) využíváme již zmíněné svítící (fluorescenční) značky navázané na dideoxynukleotidy. Každý ze čtyř možných typů nukleotidů (A, T, C a G) vyzařuje jinou barvu a umožňuje nám tedy přečíst poslední písmeno v řetězci (tam se dideoxynukleotid navázal).
Metody druhé generace
V současnosti se v praxi používá nejvíce tzv. sekvenování druhé generace, zvláště metoda Illumina (nazvaná podle firmy, která v současnosti tuto metodu zaštiťuje). Tato technologie umožňuje sekvenovat miliony úseků DNA najednou, což zrychluje a zlevňuje analýzu celého genomu (veškeré genetické informace uložené v DNA). V praxi to probíhá tak, že je genom „rozstříhán“ na úseky (fragmenty) nukleotidů o určité délce (zpravidla ne více než 200 nukleotidů) a na jejich konce jsou připojeny specifické značky (adaptéry). Úseky DNA se pak pomocí těchto značek navážou na skleněno-plastikovou destičku.
Samotné sekvenování probíhá cyklicky pomocí párování svítících nukleotidů (s fluorescenční značkou) s původní sekvencí. V každém cyklu se přidá právě jeden typ svítícího nukleotidu, který se buď naváže, pokud odpovídá bázi v původním vlákně, nebo se nenaváže, pokud párování není možné. Poté přístroj snímá, v jaké pozici na zmíněné destičce právě svítí fluorescenční značka, což určuje přidaný nukleotid. Po každém kroku se fluorescenční značka odstraní a připojí se další svítící nukleotid. Takto pokračujeme, dokud není fragment DNA „doplněn“ nukleotidy. Jelikož ve stejném okamžiku „svítí“ současně tisíce molekul, můžeme velmi rychle sekvenovat velké množství DNA fragmentů [4].
Metody třetí generace
Pro sekvenování fragmentů delších než 200 nukleotidů se používají metody tzv. třetí generace, které umožňují sekvenovat jednu molekulu DNA. Zde se nejvíce používají dvě metody. V té první nazývané SMRT sekvenace (z angl. „single-molecule real-time sequencing“, jednomolekulové sekvenování v reálném čase) se využívá podobně jako u Illuminy svítících nukleotidů doplňujících druhé vlákno DNA. [5].
Druhá metoda zvaná nanopórové sekvenování nevyužívá fluorescenční signál, ale měří změny napětí, které nastanou, když DNA prochází elektricky nabitým pórem v membráně. Každý nukleotid způsobí specifickou změnu napětí, kterou lze použít k určení sekvence [6]. Hlavní předností metod třetí generace je schopnost číst opakující se sekvence, které mohou dosahovat až milionů nukleotidů. U starších metod představovala krátká délka přečtených úseků problém, protože znemožňovala správné umístění sekvencí v genomu. To vedlo k obtížím při určování, ke které konkrétní opakující se oblasti sekvence patří. Vzhledem k tomu, že lidský genom obsahuje více než 50 % takovýchto opakujících se sekvencí, metody třetí generace jsou klíčové pro analýzu genomů lidí i dalších organismů a přispívají k hlubšímu biologickému poznání [7].
Pro Zeptej se vědce odpovídali Eliška a Vojta
Zdroje:
[1] https://doi.org/10.1073/pnas.74.2.560
[2] https://doi.org/10.1073%2Fpnas.74.12.5463
[3] Molecular Biology of the Cell, Alberts, 6. edice, kapitola 8 – Analysing cells, molecules and systems, Garland Science, NY, 2015
[4] https://doi.org/10.1038/nrg2626
[5] https://doi.org/10.1016/j.gpb.2015.08.002
[6] https://doi.org/10.1038/nbt.2147
[7] https://doi.org/10.1126/science.abj6987
Další čtení prověřené autorem:
https://www.illumina.com/science/technology/next-generation-sequencing/sequencing-technology.html