Что такое секвенирование
Секвенирование ДНК — это определение точного порядка нуклеотидов в молекуле дезоксирибонуклеиновой кислоты. Звучит сухо, но на этой простой идее держится почти вся современная молекулярная биология: от диагностики наследственных заболеваний до изучения происхождения видов.
Сегодня под «секвенированием» почти всегда понимается NGS — Next-Generation Sequencing, методы массового параллельного чтения, появившиеся в середине 2000-х. За полтора десятилетия стоимость прочтения генома упала с трёх миллиардов до нескольких сотен долларов, что превратило технологию из научного эксперимента в рутинный инструмент.
Краткая история методов
Первое секвенирование, метод Сэнгера, появилось в 1977 году и оставалось золотым стандартом более двух десятилетий. Расшифровка генома человека в 2003 году была выполнена именно им — это заняло 13 лет и обошлось примерно в 3 миллиарда долларов.
Революция началась с появлением массового параллельного секвенирования: 454 в 2005-м, Solexa/Illumina в 2006-м, SOLiD в 2007-м. Они разом увеличили производительность в тысячи раз. К 2010 году геном можно было прочитать за несколько недель и десятки тысяч долларов; сегодня — за пару дней и под тысячу долларов.
Параллельно развивалось третье поколение — single-molecule секвенирование. Pacific Biosciences (PacBio) и Oxford Nanopore читают отдельные молекулы ДНК без амплификации, что даёт длинные прочтения в десятки тысяч пар оснований за раз.
Как работает NGS
Принцип короткочтения NGS (Illumina) можно описать так: фрагменты ДНК прикрепляются к стеклянной плоскости (flow cell), амплифицируются в кластерах, а потом на каждом цикле к ним пристраивается флюоресцентный нуклеотид. Каждая позиция «фотографируется» — и из этих изображений собирается последовательность.
За один прогон современного секвенатора (NovaSeq X) можно прочитать миллиарды молекул одновременно. Каждая молекула даёт «риды» длиной 100–300 нуклеотидов, а уже на стороне биоинформатики эти короткие фрагменты выравниваются на референсный геном или собираются de novo.
NGS — это не один метод, а целая экосистема технологий: short-read, long-read, single-cell, spatial, методилом-, эпигеномное секвенирование. Под каждую задачу — свой инструмент.
Применения
Секвенирование сегодня используется почти везде, где есть биологический материал. В клинической медицине это диагностика наследственных заболеваний, подбор онкологической терапии, фармакогенетика, неинвазивный пренатальный скрининг, скрининг носительства мутаций.
В научных исследованиях — изучение микробиома, эволюции, биологии развития, иммунологии, опухолевой биологии. В сельском хозяйстве — селекция сортов и пород, контроль качества продуктов. В судебной экспертизе — идентификация останков и установление родства.
Что дальше
Тренды на ближайшие 3–5 лет: дальнейшее удешевление и расширение применений, переход long-read в клиническую практику, развитие spatial и single-cell методов, всё больше эпигенетической информации в стандартных тестах.
Появляются прикладные приложения, которые ещё пять лет назад звучали как научная фантастика: minimal residual disease мониторинг по жидкой биопсии, multi-cancer early detection, real-time PCR-free инфекционная диагностика.