Длинное слово из четырех букв – Кровь5

Алексей Каменский

Длинное слово из четырех букв

Об очень быстром и, на первый взгляд, простом способе прочесть ДНК

Для генетического типирования доноров костного мозга сейчас обычно используют технологию NGS (Next Generation Sequencing) — секвенирование нового поколения. Но у «нового поколения» уже появился удивительный потомок. Первая мысль при знакомстве с ним: все гениальное просто. Сможет ли секвенирование третьего поколения (Third Generation Sequencing, TGS) вытеснить нынешнюю технологию?

Отцы и внуки

Без генетического типирования не может быть трансплантации и не имеют никакого смысла регистры доноров. Кровь5 уже рассказывала об основном современном способе прочесть геном — NGS — и о том, как это делает главный представитель направления — компания Illumina. О том, что было до NGS, мы тоже писали. Все это крайне интересно, но находится в опасной близости к границе понимания. Чуть что — утыкаешься в нее, и приходится отступать.

А вот с TGS все, на первый взгляд, просто и понятно. Берут длинную спираль ДНК, состоящую из генетических букв-нуклеотидов. Таких букв в генетическом алфавите живых существ ровно четыре: А, B, C и T (аденин, гуанин, цитозин и тимин). У нас общий со всеми животными алфавит. И протягивают эту спираль сквозь крошечную дырочку, которая умеет эти буквы различать. Вот, в целом, и все.

В глубине лабораторий новый метод появился лет двадцать назад, название «секвенирование третьего поколения» распространилось во второй половине 2000-х, а примерно с середины 2010-х начались попытки коммерческого использования метода.

Сейчас уже несколько компаний производят устройства для такого секвенирования — это Pacific Biosciences, Quantapore, Stratos, Oxford Nanopore Technologies. На самом деле технологии у них очень разные, но в эти детали лучше не вдаваться — там все сложно.

В России присутствует Oxford: на ее оборудовании работает, в частности, компания ReadSence из троицкого наноцентра «ТехноСпарк». Но пока я договаривался об интервью, главный специалист ReadSence по TGS Глеб Спешилов заболел ковидом, а когда выздоровел, ушел из компании. Про новое место работы Глеб почти не рассказывает — это некая крупная компания, где он займется как раз развитием TGS. Но не беда, главное, он рассказал нам про саму технологию.

Спагетти и вермишель

Глеб Спешилов: Название TGS придумали как противопоставление предыдущему поколению — NGS. Более содержательное название — мономолекулярное секвенирование, потому что мы фактически работаем отдельно с каждой молекулой. Это совсем не как в NGS. Там мы обязательно должны, во-первых, изучаемые цепочки ДНК мелко нарезать, как вермишель, потому что с длинными цепочками NGS просто не справится. А во-вторых, эту вермишель надо размножить с помощью полимеразной цепной реакции (ПЦР), чтобы усилить сигнал, который собираемся получить. Иначе просто ничего не увидим.

При секвенировании третьего поколения не надо ничего ни размножать, ни резать. Мы имеем дело с отдельными молекулами, непосредственно их читаем.

Хотя на самом деле невозможно сохранить молекулу ДНК в совсем первозданном виде. В ДНК человека в сумме несколько миллиардов нуклеотидов. Молекулы ДНК длинные, тонкие и очень ломкие. С ними чисто физически невозможно работать in vitro, не разломав случайно на части. Но эти куски гораздо длиннее, чем при NGS. Если там вермишель, то здесь — спагетти.

Кровь5: Выразить длину вермишели и спагетти в точных цифрах несложно. Например, при NGS на аппаратах Illumina длина кусочков в среднем 200–400 нуклеотидов. Чем куски длиннее, тем меньше точность. А при TGS счет идет на тысячи, десятки и даже сотни тысяч нуклеотидов.

Просто флешка

Г. С.: Как мы анализируем ДНК методом TGS? Протягиваем отдельно взятую молекулу сквозь крошечное отверстие — белковую нанопору диаметром чуть больше нанометра (1/1 000 000 мм. — Кровь5). ДНК — это двойная спираль, она не пролезет, надо ее расплести. Для этого мы прикрепляем к концу молекулы специальный белковый механизм, который одновременно расплетает спираль (вторая половина уходит в отвал) и подтягивает ее к отверстию. Потом молекула ДНК начинает двигаться сквозь отверстие из-за разности потенциалов — от отрицательного полюса к положительному. Скорость прохода, она же скорость чтения, — 300–400 букв в секунду. Illumina будет читать те же буквы несколько суток. Правда, можно читать много «слов» параллельно, поэтому, например, секвенатор MiSeq от Illumina выдаст за это время 10 млрд букв.

Расходная часть нанопорового TGS-секвенатора — это картридж из двух отсеков, разделенных мембраной с порами. Молекулы загружаются с одной стороны и через дырочки переползают на другую.

Каждая пора в каждый момент времени читает всего одну букву. А пор может быть, в зависимости от модели устройства, от 500 до 2500. Самая маленькая оксфордская модель — MinION — размером с компьютерную флешку. Фактически переходник для подключения картриджа к компьютеру. Самая большая модель — PromethION — размером с принтер, я ее живьем еще не видел.

Пока нуклеотид проходит через пору, его можно «прочесть». Дело в том, что каждая из четырех генетических букв имеет свою форму, они по-разному перекрывают отверстие. Мембрана — диэлектрик, а через отверстие идет ток. По его изменению можно понять, какая буква сейчас на этом пропускном пункте. Мы получаем сигнал от каждой поры и видим в режиме реального времени, как накапливаются данные.

Легче верблюду сквозь игольное ушко

Кровь5: При NGS нужно решить непростую задачу: по огромному количеству кусочков восстановить целый текст, то есть ту часть генома, которую мы взялись анализировать. Например, участок шестой хромосомы, на котором находятся гены тканевой совместимости. Это пазл из миллионов кусочков. Но при TGS расшифровка данных еще сложнее.

Г. С.: Определить, какая в поре буква, непросто. Нельзя сказать, что у каждой буквы свой электрический сигнал. Скорее каждая буква определенным образом его меняет. Данные получаются очень «шумные» по многим причинам. Из-за того, в частности, что скорость протягивания ДНК через пору непостоянна. И сами поры живые, белковые, они постепенно умирают. Над этой проблемой работают, но пока это так. Производитель обозначил время годности картриджа с момента запуска — 48 часов, но уже через 5–6 часов в живых остается две трети пор. Это влияет на скорость получения данных. Один и тот же картридж можно использовать несколько раз, но с каждым разом он будет работать все хуже.

Насчет точности. NGS — хорошая технология (другое дело, что развиваться ей в нынешнем виде уже почти некуда), там ошибок десятые или даже сотые доли процента. А у TGS пока может доходить до десятков процентов. Но ошибки можно исправить, увеличивая количество получаемых данных (грубо говоря, много раз проверяя и перепроверяя результат), в итоге удается добиться точности, аналогичной NGS.

Между тем у технологии NGS есть значительные ограничения. Она имеет дело с маленькими кусочками генома и может не заметить больших хромосомных перестроек, например, делеций (потеря целого участка хромосомы. — Кровь5). А нанопоры благодаря длине анализируемых участков позволяют это обнаружить.

NGS и TGS можно применять совместно, получая в свое распоряжение преимущества каждой из технологий.

Я очень люблю новые технологии и TGS в частности. Одна из моих задач — внедрение этого метода в прикладных молекулярно-генетических целях. Например, нанопоры смогут успешно применяться для типирования доноров костного мозга.

Нанопоробизнес

Г. С.: Что дальше? Цены обеих технологий пока похожи. Реагенты для одного запуска MiSeq стоят в среднем 150–190 тысяч рублей. Нанопоровая химия — примерно столько же. По идее, цены должны постепенно падать, но пока это незаметно. Может, компании ориентируются друг на друга?

«Третье поколение» только начинает использоваться в медицине. До последнего времени это была технология для энтузиастов, занятых научными исследованиями. У нанопорового секвенирования практическое использование в медицинской диагностике пока еще сильно отстает от возможностей.

Я не знаю, за чем будущее. Но когда ты умножаешь ДНК, как при реакции ПЦР, всегда накапливаются ошибки. Так что в любом случае рано или поздно победит некая простая мономолекулярная технология. Когда будем смотреть прямо на молекулы.

Фото: Пресс-служба ТехноСпарка

Стать донором Помочь донорам
Читайте также