280 человек в одной пробирке – Кровь5

Алексей Каменский (текст), Юлия Замжицкая (иллюстрации)

280 человек в одной пробирке

Как прочесть генетический код сразу множества людей и не запутаться

Технология, которую использует для типирования доноров казанская лаборатория Русфонда, кажется научной фантастикой. Но она работает.


Непохожие близнецы

Организм человека устроен на первый взгляд глуповато. Представьте себе мэра большого города, который ввел драконовскую паспортную систему. Каждый горожанин с рождения и до смерти обязан носить с собой и предъявлять по первому требованию документы не только собственные, но и всех прочих жителей. Как кого зовут, когда кто родился, где живет, кем работает, чем болеет – каждый должен все знать обо всех. Зачем? Бессмыслица. Но в живом организме все именно так.

В каждой из 30 трлн наших клеток есть 46 скрученных в спираль хромосом, в которых зашифровано все, что организму досталось от рождения.

Цвет глаз, рост, болезни, будущая седина в волосах, склонность к полноте.

Но криминалистам и генетикам это только на руку. Геном человека они могут найти где угодно – в коже, слюне, волоске в носу. Для типирования потенциальных доноров в России обычно используют кровь. Типирование донора – это составление его генетического портрета. Точнее, крошечного кусочка этого портрета: не всех 40 тысяч генов, а только нескольких – генов тканевой совместимости. Их называют генами HLA. Почему – долго объяснять. Прочтите здесь, если хотите. Люди с одинаковыми генами HLA могут стать друг для друга донорами костного мозга. Их часто называют генетическими близнецами, хотя все их сходство – маленький участок шестой хромосомы, где обитают гены HLA. Врачи уверяют, что такие «близнецы» совершенно не обязаны быть похожими: гены HLA не управляют внешностью.

Найти генетического близнеца пациенту, которому нужна пересадка костного мозга, очень трудно.

Кажется, нигде в человеческом геноме нет такого разнообразия вариантов (их называют аллелями), как в генах HLA. У пяти «главных» генов тканевой совместимости сотни и тысячи аллелей.

За несколько десятилетий сменили друг друга несколько методов их расшифровки. Революция произошла с появлением NGS – next-generation sequencing, секвенирования нового поколения и соответствующего оборудования, секвенаторов. Именно его использует лаборатория в Казани, созданная два года назад Русфондом вместе с Институтом фундаментальной медицины и биологии Казанского федерального университета.

Cеквенирование – определение последовательности букв генетического кода. Своего рода чтение.

Прелесть технологии NGS в том, что она позволяет одновременно читать много генов многих людей.

Отсюда скорость, отсюда же и дешевизна. Заведующая казанской NGS-лабораторией Елена Шагимарданова рассказала, как все это происходит.


Выделяй и властвуй

– Когда к нам приходят пробирки с кровью, мы сразу же присваиваем каждой бар-код, чтобы дальше уже не было никаких персональных данных, только цифры.

Нам нужно выделить из крови ДНК. С помощью специального раствора мы разрушаем мембрану клеток – ДНК и все остальные элементы вываливаются наружу. Теперь надо очистить ДНК от всего лишнего – мы пропускаем содержимое клеток через специальную колонку. Молекулы ДНК в ней остаются, а все остальное уходит. Затем мы смываем с колонки и ДНК, чтобы использовать ее в дальнейшей работе.

В ДНК человека около 20 тысяч генов. А нас в ней интересуют только пять

(некоторые лаборатории для HLA-типирования исследуют больше генов. – Кровь5). Чтобы секвенатор смог прочесть эти гены, их нужно амплифицировать – размножить с помощью полимеразной цепной реакции (ПЦР). Для этого много чего требуется. Во-первых, праймеры – молекулы, которые умеют находить гены, которые нам нужны, и прикрепляться к ним. Во-вторых, сама полимераза – фермент, который, ориентируясь на метки, осуществляет размножение. В-третьих, нуклеотиды – кирпичики, из которых будут строиться копии генов. Размножение занимает пять-шесть часов – вечером запускаем, а утром все уже готово.

Библиотечный день

– Теперь у нас есть нечто, содержащее множество копий нужных нам генов. Мы должны подготовить их к чтению. Это так и называется: подготовка библиотеки. Это включает в себя несколько манипуляций. Мы режем гены на более короткие фрагменты, потому что секвенатор не умеет читать длинные последовательности.

А дальше происходит очень интересная вещь. Мы же хотим одновременно анализировать ДНК многих людей. Возможности нашего прибора – до 280 человек за раз. До сих пор генетический материал каждого донора находился в отдельной пробирке.

А тут мы «приклеиваем» к каждому кусочку ДНК молекулу-идентификатор. Сколько людей, столько и идентификаторов – по ним мы потом поймем, где чья ДНК. Теперь образцы можно слить в одну общую емкость.

Все это мы загружаем в секвенатор MiSeq – наш прибор для чтения.

Секреты скорочтения

– Вы читаете буквы в книжке, а наша лаборатория – нуклеотиды в геноме. В чем-то нам даже проще.

В русском алфавите 33 буквы, а в генетическом – всего четыре: А (аденин), G (гуанин), C (цитозин) и T (тимин).

Разные последовательности букв образуют «генетические слова», слова складываются в «генетические фразы», в которых записана вся наследственная информация.

Как прочесть букву? Мы используем специальные молекулы четырех видов, каждый может прикрепляться только к одной из букв. И не просто прикрепляться, а еще и излучать при этом свет. Секвенатор пропускает через загруженный в него материал молекулу-маркер для буквы A – и понимает, что всюду, где начало светиться, стоит А, нуклеотид аденин. И запоминает эту информацию. Потом выпускает другую молекулу-маркер, и так много циклов подряд. Последовательно, букву за буквой, секвенатор считывает структуру всех кусочков ДНК, которые в него загружены.

Есть загвоздка. Секвенатор прочел только фрагменты генов. Любой ген HLA намного длиннее последовательности, которую наш прибор в состоянии прочесть. Например, в гене HLA-A 7 тысяч «генетических букв». Тут все как в языке. Я вам показываю четыре фрагмента: «азин», «Ва», «шелвмаг», «сяпо». Вы же, если подумаете, сможете собрать из них «Вася пошел в магазин»? В секвенаторе то же самое, только кусочков гораздо больше и они могут перекрываться. Поэтому собирать из них фразы мы поручаем компьютеру – есть специальная программа.

Старые знакомые и новички

– Мы довольно хорошо знаем, какие аллели бывают у генов тканевой совместимости. Собрав пазл из кусочков генов, которые в него загружены, секвенатор получает последовательности генетических букв каждого из пяти генов каждого из 280 людей. 1400 очень длинных цепочек. Что дальше? Эти цепочки сравниваются с базой данных, где записаны все известные нам аллели этих пяти генов, все известные цепочки. Многие тысячи вариантов. Гены HLA обозначают буквами A, B, C, DR и DQ, а дальше идет несколько цифр, которые шифруют эти самые варианты – аллели. Ну например, HLA-A*02:01:01.

Когда собираешь очень большой пазл, цена ошибки велика. Вставил кусочек, вроде бы подошел, а на самом деле нет – и все пошло не так.

Техника может ошибаться. Поэтому мы, люди, должны мониторить результаты секвенирования. Например, образец мог оказаться загрязненным, и секвенатор мог прочесть его неправильно.

А бывает так, что мы обнаруживаем новый аллель – такой, с которым до нас ни одна лаборатория в мире не сталкивалась. Мы его отправляем на проверку в общую международную информационную базу IMGT (ImMunoGeneTics information system) Если все правильно, наш аллель включают в базу, которая обновляется раз в три месяца.

Время и деньги

– У нас расклад по времени такой. Первый этап – пока зарегистрируем все пробирки, выделим ДНК, проведем ПЦР, подготовим пробы для анализа – это один-два дня. Трое суток работает секвенатор. Дальше – самая трудоемкая часть: анализ данных. Но ведь у нас поток: пока анализируем, уже можно запускать следующую партию.

Главный наш прибор – секвенатор. После него с данными работают только компьютеры и люди. А до него – много приборов. Аппарат для выделения ДНК, ПЦР-амплификаторы, другое оборудование.

И каждому прибору нужны свои реагенты – вещества, участвующие в реакциях, которые в этом приборе происходят. Мы их покупаем наборами.

Есть набор для выделения ДНК. Еще один, самый дорогой, – для ПЦР и подготовки библиотеки. Третий – для самого секвенирования, его нам поставляет компания Illumina, производитель секвенатора. В нем есть картридж для секвенирования, светящиеся маркеры, много чего еще.

В этой области все ужасно быстро совершенствуется. NGS нет смысла даже сравнивать с прежними технологиями.

Вспомните: первое секвенирование человеческого генома стоило 3 млрд долларов и заняло десять лет – с 1990 по 2000 год. NGS позволяет сделать это за тысячу долларов в течение суток.

А ведь уже появился еще более продвинутый метод – TGS, third-generation sequencing. Такой аппарат способен читать гораздо более длинные генетические фразы. Это очень круто. Но пока и очень дорого.

***

При полной загрузке MiSeq одно типирование обходится Русфонду, с учетом всех накладных расходов, в 9600 рублей в расчете на одного донора. Это очень низкая цена, и получается она благодаря тому, что типируют 280 человек одновременно. 9600 рублей – это примерно втрое меньше расходов на типирование в центрах Минздрава. Или по-другому: за те же деньги мы можем включить в Национальный регистр доноров костного мозга имени Васи Перевощикова (Национальный РДКМ), который строит Русфонд, втрое больше потенциальных доноров и таким образом увеличить вероятность того, что для каждого нуждающегося в трансплантации в регистре найдется свой генетический близнец.

У Национального РДКМ нет никаких других денег, кроме пожертвований. Для каждого донора типирование бесплатно, но, чтобы доноров становилось больше, нужны не только добровольцы, желающие спасти другого человека, но и неравнодушные люди, готовые помочь деньгами на реагенты. Если вы решите поддержать регистр, сделать это можно по ссылке. А мы говорим большое спасибо нашим жертвователям – ведь без них мы не могли бы работать.

Стать донором Помочь донорам
Читайте также