26 Июня 2014

Третья революция в биомедицине

Жизнь – это компьютер

Андрей Константинов, «Русский репортер» № 24-2014

Когда-то главным орудием биологов были сачок и лупа. Потом – микроскоп и пробирки. Сейчас основным инструментом, необходимым для понимания жизни, становятся информационные технологии. Чтобы проникнуть в тайны биоинформатики, мы поговорили с несколькими нобелевскими лауреатами, узнали, почему геном человека до сих пор не расшифрован, увидели, как физтех превращается в биотех, а физики – в биологов, и даже почти поняли, как ученые читают генетический код и перепрограммируют живые клетки

Филлип Шарп получил Нобелевскую премию «за открытие прерывистой структуры гена»
Фото: Michael Buckner/Getty Images for Entertainment Industry Foundation/Fotobank

Слушаю лауреата Нобелевской премии Филлипа Шарпа:

– Мы называем это третьей революцией в биомедицине. Первой было открытие структуры ДНК, второй – расшифровка генома. Сейчас происходит третья революция – слияние науки о жизни с математикой и информационными технологиями. Когда-то физики дали инженерам электрон, и в мире началась IT-революция. Потом биологи дали инженерам ген, и вместе они создадут будущее.

В Сколково на конференции «Терапия будущего» встретились сразу два нобелевских лауреата. Первый – Филлип Шарп, получивший премию за открытие прерывистой структуры генов. Второй – Синья Яманака, сумевший превратить обычные клетки в стволовые, то есть в те, которые могут переродиться в любые ткани организма.

Помимо Нобелевки сдержанного японца и харизматичного американца объединяет то, что оба они рассказывают, как передается и обрабатывается информация в живых клетках и между ними. Для них биологические системы – это своего рода живые компьютеры, и тут вполне уместен язык информатики. Наука, занимающаяся изучением биологических «программ» и «компьютеров», называется биоинформатикой.

С точки зрения биоинформатики ядро каждой клетки – что-то вроде микроскопической флешки огромной вместимости. Внутри ядра, на молекулах ДНК, записаны программы, одни и те же для всех клеток организма, но каждый клеточный компьютер выполняет их по-своему в зависимости от внешних сигналов. Если мы сумеем прочитать код и понять принципы работы клеточного компьютера, то сможем управлять программой сами. Может ли быть перспектива заманчивей этой?

В подтверждение своих слов Шарп показывает карту окрестностей Массачусетского технологического института, окруженного плотным кольцом крупнейших мировых биотехнологических и IT-компаний, стремящихся даже физически быть как можно ближе к лабораториям, в которых делаются открытия.

Перепрограммисты

Синья Яманака впервые в мире получил индуцированные плюрипотентные стволовые клетки, за что ему и дали Нобеля
Фото: Noah Berger/Bloomberg via Getty Images/Fotobank

Изменение генетических программ – одна из самых горячих тем современной биологии. Наверное, каждый видел фотографии зеленых светящихся кроликов и свинок. Выглядит забавно, а достигается за счет внедрения гена флуоресцентного белка в геном животного. Это примерно то же, что дополнить свой Windows программой от Google. Из той же серии лечение наследственных заболеваний или создание бактерий, производящих топливо и лекарства.

Но можно не только дополнить «операционную систему» живого организма «приложениями» других производителей. Есть возможность заставить работать по-другому уже имеющуюся программу.

В 2006 году успехи всех «перепрограммистов» живых клеток затмил Синья Яманака. Он взял клетку из кожи мышиного хвоста и превратил ее в плюрипотентную – ту, которая может порождать любые клетки организма. Настоящий рай для медиков. Уже в следующем году Яманака сумел повторить свой успех на человеческой клетке.

Интересуюсь у нобелевского лауреата:

– Как происходит перепрограммирование обычной клетки в ту, которая может стать любой тканью? – Суть очень проста: мы вводим четыре белка. Каждый из них – это сигнал, включающий какие-то гены, запускающий сложный каскад реакций, которые и приводят к тому, что небольшая часть клеток в исходной ткани превращается в плюрипотентные. Это что-то вроде перезагрузки клеточного компьютера, но как именно это происходит, мы, вообще говоря, мало понимаем, тут еще работать и работать.

– Как же вы поняли, что нужны именно эти четыре белка?

– Можно сказать, методом тыка: у нас было 24 кандидата, и мы экспериментировали на мышах, пока не нашли то сочетание четырех белков, которое работало. – А как потом превратить плюрипотентную клетку в нейрон или клетку крови? – Мы использовали накопленные наукой знания, как эмбриональные клетки превращаются в клетки мозга или сердца. Пока мы умеем делать только некоторые – клетки легких, например, не умеем, клетки поджелудочной железы получаются незрелыми. Повторю: мы и десятой доли еще не знаем о том, как работает наше тело. Все впереди.

– Это вообще не опасно? Если мы так мало знаем, как работают эти клетки… Вдруг они начнут размножаться, как раковая опухоль?

– Во время производства плюрипотентных клеток возникают мутации. Но мы используем новейшие технологии секвенирования, чтобы прочесть их геном, отследить вредные мутации и выбрать только безопасные клетки. Семь лет назад, когда мы начинали, риск мутаций был очень высок, но технология быстро совершенствуется, и сейчас этот риск намного меньше. Он еще не нулевой, но мы вплотную подошли к стадии клинических испытаний.

– Правильно ли я понимаю, что пересадка таких клеток позволит лечить болезни, исправлять мутации?

– Над этим сейчас работает много лабораторий по всему миру. К клиническим испытаниям пока никто не приступил, зато были успешные эксперименты над животными. В теории все должно сработать, но до клиник дойдет лет через десять, не раньше. В идеале же нужно научиться делать так, чтоб мы не пересаживали такие клетки, а организм сам их производил, лечил и омолаживал себя, когда нужно. Я мечтаю об этом.

Геном человека до сих пор не прочитан

Проект по расшифровке генома человека стоит чуть ли не в одном ряду с полетом на Луну. Правда, люди долетели до нее еще полвека назад, а обещанных лунных поселений и рудников мы так и не получили – слишком много технических сложностей. С геномом происходит нечто подобное. Главная проблема – гигантский объем данных.

Мы разговорились с Аллой Лапидус, замдиректора лаборатории алгоритмической биологии Академического университета РАН, созданной в 2011 году в рамках программы мегагрантов.

– Наша задача – составлять программы, с помощью которых врачи и биологи будут анализировать геном человека, – рассказывает Алла. – Они очень нужны, потому что количество производимых данных просто невероятно. Расшифровка лишь небольшой части генома, которая кодирует белки, дает полтерабайта данных. Если сравнивать геном с книгой, то получается, что нужно прочитать роман в 10 000 раз длиннее «Войны и мира». Непростая задача для врача из поликлиники. И это только исходные данные, необходимые для первичного анализа реального пациента. Представляете, какого объема должно быть хранилище данных в клиническом центре, куда приходят 3-4 тысячи пациентов? – восклицает Алла. На сегодняшний день расшифровать ДНК куда дешевле, чем хранить эту информацию. Не анализировать, а просто хранить. Поэтому айтишники учатся новым методам сжатия информации.

– Вообще-то, полностью геном человека до сих пор не прочитан, – признается Алла. – Современные методы расшифровки основаны на чтении маленьких кусочков с последующей реконструкцией всей хромосомы. Из-за этого участки, где много повторов, трудно восстановить. Года три назад Национальный институт здравоохранения США выделил три с половиной миллиона долларов на то, чтобы закрыть бреши в геноме человека. Я очень хорошо знаю женщину, которая получила этот грант, она исключительно талантлива – если не сделает она, то не сделает никто. Пару месяцев назад они выложили новую официальную сборку человеческого генома. И все равно с дырками.

– Где находятся эти «белые пятна» нашего генома?

– Очень много повторов на концах хромосом. Разобрать эти куски современными методами невозможно, поэтому они не расшифрованы. Но постепенно технологии позволяют прочитать разом все более длинные куски ДНК – когда-нибудь мы узнаем весь геном. Сейчас наука дошла до понимания, что недостаточно просто выяснить последовательность букв в нашей книге жизни. Появились новые проекты – «Транскриптом человека» и «Протеом человека». Отследив лишь изменения в геноме, вы мало что узнаете, – объясняет мне Алла. – Ну, нашли вы точку в геноме, которая изменилась, но что эта мутация значит, каким образом она меняет работу организма? Подавляет она синтез белка или, наоборот, интенсифицирует? Такие вещи нужно смотреть не на уровне ДНК, а на уровне РНК, потому что количество вырабатываемого белка определяется уровнем РНК. Знаете основную догму биологии: с ДНК считывается РНК, а уже с РНК – белок? Количество молекул РНК, произведенных каждым геном, показывает, насколько активен этот ген, сколько белка вырабатывает. Информация обо всех РНК, показывающая, насколько активно работают гены, называется транскриптомом, это следующий этап анализа после генома.

– И транскриптом тоже нужен не только ученым, но и врачам?

– На основании данных транскриптомики врач может выписать лекарство, восстанавливающее уровень вещества, упавший из-за мутации, или, наоборот, тормозящее производство этого вещества. Например, щитовидная железа при разных типах нарушений может производить слишком много или очень мало своего гормона. Ну а третий этап анализа – это протеом, то есть совокупность всех белков, присутствующих в организме. Нужно посмотреть, где и в каких количествах эти белки находятся: там, где им положено быть, или в местах, где их никто не ждет и они никому не нужны.

– То есть помимо данных расшифровки генома, которые и так хранить негде, современным клиникам нужна еще информация о транскриптоме и протеоме?

– Именно. На каждом из этапов возникает очень много данных, и нет возможности сложить их вместе и хранить. Это существенно тормозит развитие персонализированной медицины. Нужен комплексный подход к анализу организма и компьютерные продукты, которые помогут этот анализ проводить. Поэтому мы, биологи, вступили в естественный альянс с математиками, научились слушать IT-специалистов.

– И вы уже выпустили какой-то продукт?

– Да, мы занялись сборкой геномов микроорганизмов и выпустили программу для их анализа. Этому инструменту два года, и его уже используют тысячи лабораторий по всему миру.

– Для микроорганизмов вроде кишечной палочки?

– Для любых бактерий. С кишечной палочкой все просто: сливаете в банку разные полезные вещества, помещаете ее туда, и утром нарастает много материала. При этом многие организмы, которые живут в нашем теле, некультивируемые: их невозможно вырастить в лаборатории. И их подавляющее большинство – на сегодня мы умеем выращивать не больше 5-6% микроорганизмов. А нам надо просеквенировать сразу всю эту кучу живущих внутри нас бактерий – это называется метагеномика, – и возникает задача вычленить каждого в этом сообществе. Современные технологии позволяют растащить все эти клетки, оставив одну-единственную. Но в ней очень мало ДНК – нужно как-то ее размножить, сделать так, чтобы ее стало больше, а потом секвенировать и собрать нужные данные.

– Для чего это делают?

– Допустим, вам сделали операцию, и пошел воспалительный процесс, или вы неправильно питаетесь, и из-за изменений микроорганизмов желудочно-кишечного тракта началось заболевание. Или вот есть дети-аутисты – доказано, что микрофлора их желудочно-кишечного тракта сильно отличается от нормы, у всех аутичных детей проблемы с желудком. Изучают, что здесь первично, а что вторично: болезнь вызывает эти изменения, или сами они являются причиной заболевания – например, если какой-то микроорганизм выделяет токсины, влияющие на мозг. Все время возникают новые задачи, связанные с необходимостью секвенировать геномы различных организмов: для разных грибов или животных нужны свои подходы. Но в итоге мы хотим создать универсальный инструмент, подходящий для любых организмов или близкий к этому.

Клетка вместо атома

Оказывается, в МФТИ, цитадели российской физики, теперь тоже вовсю занимаются биологией. В прошлом году там был создан факультет биологической и медицинской физики, заработали геномный центр и центр клеточных технологий, был открыт Центр живых систем МФТИ. На конференции «ФизтехБио-2014», тоже не обошедшейся без пары нобелевских лауреатов, мы встречаем ее организатора, руководителя Центра живых систем профессора Андрея Иващенко.

– Вы же физтех, а не биотех! Почему именно живые системы оказались сейчас самым важным делом?

– Просто XXI век – это век изучения живых систем, это мировой мегатренд. То место, которое в XX веке занимала физика, теперь заняла биология, да и вообще это разделение больше неактуально. Честно говоря, я уже устал объяснять, почему в физтехе занимаются медициной. «Таблеточники, во что вы превращаете физтех? Вы же физики, должны делать ракеты и ядерные бомбы!» – говорят нам. Даже боюсь признаться, но мы еще собираемся заняться аквакультурой и агротехнологиями, там ведь тоже расцвет биотеха. Я думаю, лет через двадцать большая часть сельского хозяйства будет в океане: земли не хватает, а в океане много воды, планктона, биомассы намного больше, чем на поверхности земли.

– Но мы традиционно сильны в физике и математике! Не получится ли как с конверсией при Горбачеве, когда вместо ракет стали выпускать кастрюли?

– Ракеты мы делаем, просто они отошли на второе место. Физика сейчас очень нужна как фундамент, инструмент для химии и биологии. Посмотрите, самые прорывные медицинские центры выросли из естественнонаучных университетов. И мы собираемся создать у себя исследовательский госпиталь, который будет обеспечивать перевод научных достижений в практику. Кстати, лучший ответ на вопрос, что делают физики и математики в биологии, – это работа нобелевского лауреата Майкла Левитта, одного из отцов биоинформатики. Он физик по образованию, а премию получил за моделирование молекул белка. Нобелевский комитет долго не мог понять, за что ее вручить: за химию, физику или физиологию с медициной.

Биоинформатика в многомерном мире

Майкл Левитт Нобелевскую премию получил «за компьютерное моделирование химических систем»
Фото: Pascal Le Segretain/Getty Images/Fotobank

Несмотря на зубодробительные формулировки, описывающие его исследования, Майкл Левитт оказывается очень милым, искренним и общительным человеком.

– Как получилось, что именно вы получили Нобелевскую премию?

– Ответ на этот вопрос очень прост: мне нравилось играться с компьютером. Но в конце 60-х персональных компьютеров не было, и вообще они были большой редкостью. Я выбрал профессию и лабораторию так, чтобы можно было вволю наиграться.

– Что представляет собой биоинформатика сегодня?

– Книга жизни написана на языке информатики, и надо заметить, пока еще мы весьма далеки от ее понимания. Методы анализа информации в ДНК в целом те же, что и при анализе документов или книг. Вот вы пишете что-нибудь в ворде, а потом нажимаете кнопку, которая позволяет отследить все внесенные изменения. Ворд запускает алгоритм сравнения нового текста со старым – та же программа используется для сравнения двух цепочек ДНК. Такие алгоритмы имеют универсальный характер, поэтому можно сказать, что Google, создавая правила работы с большими данными, больше всех сделал для биоинформатики.

– И получается все обработать?

– Сейчас количество данных растет быстрее, чем способности наших программ их обрабатывать. Это связано с заблуждением многих работающих в этой области людей – будто можно просто взять данные и начать их анализировать, не имея никакой модели объекта или процесса, который эти данные породил. Сейчас много говорят об анализе больших данных применительно, например, к покупкам: из информации, кто что приобретает, пытаются сделать выводы, кто что будет покупать в перспективе. Но тут недостаточно корреляций между цепочками цифр – нужно понять психологию людей, построить модель их поведения. Хороший анализ данных всегда требует создания такой модели поведения изучаемого объекта. Это сложно, недостаток хороших моделей биологических объектов – серьезная проблема биоинформатики.

– Чем, кроме анализа генома, может заниматься эта наука?

– Сейчас чаще всего говорят о расшифровке ДНК – длинной одномерной цепочки символов. Но я, например, работал совсем в другой области: моделируя большие молекулы, я имел дело с трехмерным пространством, даже четырехмерным, если учитывать изменения этих молекул во времени. Область 3D-моделирования чем-то напоминает архитектуру, она очень сложна. Легко сравнивать две цепочки символов и гораздо труднее – два трехмерных объекта.

– То есть просто с геномом вам работать скучно?

– Конечно нет! Сейчас моя группа работает над предельно сложными, почти нерешаемыми проблемами – я люблю такие. Например, мы собираем информацию о расшифрованных геномах всех видов, живущих на планете. У нас есть около 20 тысяч таких геномов. Уже известно около 500 общих функций, выполняемых разными их участками, и мы пытаемся их сравнивать.

– Что дальше?

– Я думаю, самое интересное связано с моделированием жизни организма как целого, то есть таких процессов, как старение или эволюция.

– Вы один из первых, кто пришел в биологию из физики и математики. Сейчас так поступают многие – не возникают ли у них трения или недопонимание с биологами?

– Физики и математики начали приходить в биологию еще в 50-е. Уже Джон фон Нейман, математик, стоявший у истоков информатики, очень серьезно интересовался биологией. Между математиками и биологами нет разногласий, но стиль мышления у них действительно различается.

– Чем же?

– Математическое мышление опирается на небольшое число исходных принципов, аксиом, а мышление биологов опирается на историю. Ведь биология – история того, что происходило с генетической информацией на протяжении последних четырех миллиардов лет. Это делает математический и биологический подходы очень разными. Физикам и в голову не может прийти, что скорость света могла меняться с возрастом Вселенной, они привыкли к константам. А в биологии все меняется со временем. Здесь велика роль случайности – если вернуться в прошлое на машине времени и все повторить, история станет другой из-за каких-то неожиданных мелочей… Мне кажется, в школе нужно меньше изучать сложение дробей и прочую теорию цифр и намного больше основы статистики: это гораздо важнее! Сегодня для большинства людей вероятность один на тысячу и один на миллион примерно одно и то же. Но ведь разница огромна – это как иметь тысячу долларов или миллион. Мне кажется, что непонимание таких вещей – серьезная проблема.

– То есть союз двух областей знаний труден, но возможен?

– Биологам и математикам есть чему поучиться друг у друга. Здорово, что сегодня благодаря интернету учиться стало так легко. Вот недавно я заинтересовался теорией графов – сначала нашел программы, которые мне все показали, а потом и специалистов, с которыми смог обсудить возникшие у меня вопросы. Разобраться в чем-то, чего ты раньше не понимал, – что может быть лучше!

– Говорят, что биология – это физика сегодня в смысле объединяющей роли, которую она стала играть в науке.

– Биология прекрасна и полезна. Как мы видим, слышим, думаем, болеем и выздоравливаем – все это биология, нет науки важнее. И ведь она имеет дело с необычайно сложными процессами – возможно, они проходят на таком уровне, который даже наноинженерам пока недоступен. Или вот ученые никак не могут синтезировать какую-то молекулу, а обычное растение или даже бактерия это умеет! Способности растений к синтезу просто поражают меня. Я тоже думаю, что биология сегодня – это фокус, ключевая область науки, которая собирает под свое крыло специалистов из самых разных областей.

– Может, традиционные границы между науками скоро вообще сотрутся?

– Деление на математику, физику, биологию устарело – думаю, оно изменится. Оно создано словно для самозащиты, чтобы отгородиться от остальных: типа, если я математик, то не должен прислушиваться к химикам. Но это же безумие! Как если бы ты был националистом и обращал внимание лишь на высказывания людей с определенным цветом кожи. Представитель любой науки может дать для решения проблемы что-то ценное. Это как в жизни – каждый в итоге оказывается чем-то полезен. У меня в группе физики, химики, биологи, математики, компьютерщики, и когда они вместе работают над чем-то, то хотят учиться друг у друга.

– Наверное, глядя на вас, они мечтают о Нобелевской премии?

– Знаете, это странная штука. Вы вдруг получаете награду не за то, чем занимаетесь, а за то, что делали давным-давно. Поэтому она не приносит так уж много радости, ведь я живу не прошлым, а будущим, верю, что самое интересное впереди. Что может быть хуже, чем сказать: «Ну все, я закончил, пора на покой».

Основные понятия книги жизни

Биоинформатика – изучение информационных процессов в живых системах. На сегодняшний день это в первую очередь математические методы анализа геномов, во вторую – моделирование пространственной структуры белковых молекул.
Геном – наследственная информация, копия которой содержится в каждой клетке организма, записанная на молекулу ДНК. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре клетки, а также из особой митохондриальной ДНК. Всего ДНК человека содержит около трех миллиардов «букв». Мы читаем этот «текст» с помощью секвенирования.
Ген – «запись» на ДНК, кодирующая структуру молекулы РНК, которая копируется с этой записи и отправляется выполнять разные функции – производить определенный белок, участвовать в обмене информацией и т. п. У человека около 25–30 тысяч генов, это лишь 1,5% ДНК. Все остальные ее «записи» пока кажутся нам бессмыслицей.
Транскриптом – это набор РНК, присутствующих в организме. Геном у всех клеток одинаковый (есть небольшая разница из-за мутаций и у половых клеток 23-й хромосомы), а транскриптом всегда разный: он зависит от того, какие гены в данный момент активны, а какие нет.
Протеом – набор белков, синтезируемых организмом. Их состав изучают с помощью масс-спектрометрии. Белков во много раз больше, чем генов, потому что одна и та же цепочка аминокислот, из которых состоит белок, может сворачиваться в различные пространственные конфигурации с совершенно разными свойствами.

Портал «Вечная молодость» http://vechnayamolodost.ru
26.06.2014

Третья революция в биомедицине

Жизнь – это компьютер

Статьи по теме

Биоинформатика для биомедицины

Биоинформатика – медицине

Мою ДНК хакнули

Геномная биоинформатика

Поездка на IV съезд общества биохимиков и молекулярных биологов