03 Февраля 2015

Как извлечь пользу из расшифрованных геномов?

Игра в интерпретации

Светлана Беляева, «Поиск» № 4-5 – 2015

Современная биологическая наука все больше сближается с математикой и информатикой. Объемы уже собранных биоданных таковы, что без применения новейших информационных технологий их анализ не провести. А наступающая эпоха персональных геномных данных, когда будет прочитан генетический код практически любого человека, ставит новые вопросы: как извлечь максимальную пользу из полученной информации?

Наш собеседник – выпускник биофака МГУ, а ныне – ведущий специалист по компьютерной геномике департамента онкологии Оксфордского университета и один из участников проекта «Genomics England» Александр Канапин. Первый вопрос, который задал ученому корреспондент «Поиска», касался хода выполнения этого проекта.

– «Genomics England» – это государственная программа по секвенированию 100 тысяч индивидуальных геномов пациентов, которая реализуется правительством Великобритании, – отметил Александр Канапин. – Аналогичные проекты запущены в США и Китае. Британская программа была принята в 2012 году и постепенно реализуется. Сейчас мы работаем с пилотными данными, результатами самых первых экспериментов, которые к нам пришли. Суть проекта такова: биологические образцы 100 тысяч пациентов по всей стране собираются и сохраняются в определенных условиях (биобанках), а затем постепенно производится их полное геномное секвенирование. Особый интерес вызывают наследственные заболевания, самая разнообразная онкология и инфекционные болезни: СПИД, гепатит С и туберкулез. Наша научная группа участвует в нем в проектах по компьютерной геномике.

– Ваша научная область переживает сейчас бурный рост.

– Совершенно верно, и связано это с уже имеющимся большим количеством геномных данных (как известно, стоимость прочтения геномов отдельных организмов, включая человека, в последние годы сильно снизилась), необходимостью приложения методов вычислительной математики к их анализу.

– Можно ли говорить, что в биоинформатику пришла эпоха Больших Данных и ученые сегодня захлебываются в той информации, которую получили?

– Безусловно. Один из основных вызовов, с которыми сталкивается биоинформатика, сформулирован британским профессором Джорджем Черчем: «Геном за тысячу, его интерпретация за миллион» («1K Genome and 1M Interpretation»). Сейчас сотни геномов находятся в разработке, то есть объемы данных растут, но эта информация все еще очень далека от практического использования. Во многом это обусловлено тем, какие данные производят современные технологии.

Пока можно сказать, что мы «ищем под фонарем». У нас есть некоторая базовая последовательность генов, тот самый знаменитый «Геном человека», который был расшифрован почти 15 лет назад и с тех пор уточняется и улучшается. Проблема в том, что это не индивидуальный геном, а некоторый усредненный «консенсус», собранный из геномов людей (в проекте были задействованы десятки доноров) разных рас, разного происхождения и т.д. Сегодня, когда ученые пытаются прочитать геном конкретного человека, они сравнивают его с этим «консенсусом». Вообще, последовательность генома дает статичную картину. Это описание того, с каким набором «генетических инструкций» мы родились. Как они будут работать в течение жизни, каким образом и в какой степени проявят себя, зависит от огромного количества внешних факторов. К тому же анализ данных сводится преимущественно к поиску различий между людьми и через эти различия – к объяснению функции того или иного участка генома, например, в наследственной болезни.

Сегодня прочтение полного генома человека может стоить около 1000-1500 долларов, при этом цена быстро снижается. Чем больше пациентов с той или иной болезнью будет проанализировано, тем надежнее будет статистика и тем точнее удастся определить генетические маркеры, соответствующие данному заболеванию. Неудивительно, что в настоящее время генетическая диагностика переживает новый бум.

– И все же, насколько эти сведения могут быть полезными, когда они перейдут в практическую плоскость? Узнать свой геном за 1000 долларов могут себе позволить многие, но что даст это знание, есть ли в достаточном количестве специалисты, которые смогут его интерпретировать?

– Действительно, изучение конкретных геномов становится распространенной практикой. В большинстве методик секвенирования геном разбивается на короткие фрагменты (длиной в несколько сотен букв-нуклеотидов), которые очень быстро прочитываются тем или иным физико-химическим способом. И если говорить о том, готовы ли специалисты к тому, чтобы использовать эту информацию во благо пациенту, то нужно признать, что врачи достаточно консервативны, и, чтобы что-то новое внедрить в их практику, нужно долго и методично их убеждать пользоваться тем или иным методом. Есть еще одна проблема – в стандартизации имеющейся информации. Если говорить о Великобритании, то проект «Genomics England» во многом направлен на ее решение.

– Почему это важно?

– Есть такое явление, как агрессивная маркетинговая политика компаний, которые производят секвенаторы. Некоторые предлагают чуть ли не в каждой поликлинике (в том числе и в российской) поставить свой секвенатор. Но проблема не в том, чтобы закупить новейшее оборудование, а в том, что в нем «зашито» определенное программное обеспечение – разное у каждого производителя. Получается, что каждая компания решает за вас и за врача, какими методами анализировать ваши данные и какой участок вашего генома заслуживает внимания.

– Какова будет продолжительность проекта «Genomics England» и когда станут доступны его результаты?

– Пока планируется продолжать его до 2018 года, процедура секвенирования должна завершиться к 2017 году. К этому моменту все 100 тысяч геномов должны быть прочтены и «сложены» в Центр данных, который сейчас находится в процессе создания. Я думаю, что последующий анализ геномов займет еще не менее пяти лет.

– И что тогда? Чем его результаты обогатят человечество?

– Я могу привести пример статьи, авторы которой, проанализировав геномы 20 пациентов, выявили новую мутацию одного из генов у людей, страдающих редкой наследственной болезнью (врожденный миастенический синдром). В результате были выработаны клинические рекомендации по ее лечению. Это, на мой взгляд, и есть цель, к которой нужно стремиться.

– Как складывается ваше взаимодействие с российскими коллегами?

– Оно происходит в основном по линии европейского консорциума ELIXIR, созданного в 2006 году и призванного координировать межгосударственные усилия в области сбора, хранения и качества биологических и медицинских данных, включая разработку стандартов, безопасности данных, протоколов обмена данными, подготовки кадров. Я в этом консорциуме являюсь представителем России, которая пока не совсем в него включена, ее роль – наблюдательная. Этот консорциум не научный, а скорее инфраструктурный. Идея в том, чтобы вся биологическая информация, которая тем или иным способом добывается, не носила хаотический и разрозненный характер, а соответствовала единым стандартам, позволяющим проводить корректные сравнения.

Исходя из опыта ELIXIR, я пытаюсь донести до Минобрнауки информацию о том, что такого рода проекты нельзя финансировать по принципу обычных научных грантов: дали денег на три – пять лет, сделали какую-то работу и остановились.

Достаточно известный ученый в области биоинформатики Юан Берни (Ewan Birney) сравнил однажды труд биоинформатиков с работой водопроводчиков. Согласитесь, если отключат водопровод, то всем будет плохо... В таком сравнении нет ничего обидного, потому что как функционирование современной городской среды немыслимо без бесперебойно работающей водопроводной сети, так и планирование обычных экспериментов в биологии и медицине невозможно без информации, предоставляемой биоинформатическими ресурсами: базами данных, средствами анализа и им подобными.

То есть нужна некая инфраструктура, которую необходимо создавать и поддерживать в масштабах государства точно так же, как поддерживают городское хозяйство: электричество, водоснабжение, телефонную связь и все остальное. Проблема в том, чтобы создать в России похожую инфраструктуру, которая требует своих стандартов, сертификации.

Многое здесь зависит от компьютерных программ и алгоритмов. Приведу достаточно анекдотический пример. Я разговаривал с людьми, которые пишут программы для анализа данных, и они рассказывали, что, проанализировав данные пациента разными версиями программ, получили разные результаты. «Так что нам сказать пациенту?» – в итоге недоумевали они. Выход – формулировать стандарты, проводить сертификацию, чтобы новые методики могли приходить в отечественную медицину.

Портал «Вечная молодость» http://vechnayamolodost.ru
03.02.2015

Нашли опечатку? Выделите её и нажмите ctrl + enter Версия для печати

Статьи по теме