18 Февраля 2008

Распределенные вычисления для персонализированной медицины

Онкологический институт Нью-Джерси (Cancer Institute of New Jersey, CINJ), несколько университетов США и компания IBM объединили усилия с целью создания сетевых информационных технологий для проведения высокопроизводительного анализа тканевых микрочипов с целью повышения точности и скорости диагностики онкологических заболеваний.

Еще несколько лет назад всех пациентов с одним и тем же диагнозом лечили согласно одному протоколу, например, химиотерапевтическому. Если это не оказывало желаемого действия, пациентов переводили на другой препарат, который, в случае необходимости, заменяли третьим и т.д. В настоящее время врачи постепенно переходят от лечения «методом проб и ошибок» к персонализированной медицине – подбору оптимального метода лечения на основе результатов генетических тестов.

Для выполнения работ в рамках совместного проекта по развитию персонализированной медицины, получившего в прошлом октябре грант Национальных институтов здравоохранения в размере 2,5 миллионов долларов США, ученые используют тканевые микрочипы, алгоритмы распознавания образов и сетевые суперкомпьютерные вычисления.

По словам Дэвида Форана (David Foran), директора Центра биомедицинской визуализации и информатики CINJ, на каждый используемый в работе микрочип наносят образцы, в состав которых входят ткани различных типов. Участвующие в проекте специалисты разработали программное обеспечение, позволяющее отличать эти гетерогенные фрагменты тканей и идентифицировать присутствие в них специфических онкологических биомаркеров. Специальная компьютерная видеосистема, также созданная в рамках проекта, позволяет определять локализацию маркеров в той или иной ткани, а также их принадлежность к определенным клеточным элементам (например, ядру или цитоплазме). Все эти данные сопоставляются с клиническими результатам лечения конкретных пациентов.

Для подтверждения концепции, необходимого для получения финансирования проекта, ученые CINJ провели ретроспективное изучение образцов тканей более чем 100000 пациентов с заведомо известными диагнозами и проанализировали результаты с помощью специализированного программного обеспечения. Программисты компании IBM предоставили сетевой доступ для использования этих программ и провели обработку информации с помощью сети распределенных вычислений World Community Grid (WCG) – созданного IBM «виртуального суперкомпьютера», предназначенного для проведения подобных работ. Для проведения вычислений такого масштаба с помощью обычного настольного компьютера потребовалось бы 2900 лет, в то время как у WCG это заняло менее 6 месяцев.

По завершении анализа исследователи получили возможность сопоставить выявленные профили биомаркеров с результатами диагностики и лечения. В результате обнаружены выраженные корреляции профилей экспрессии биомаркеров с различными типами заболеваний и их стадиями.

В настоящее время специалисты планируют расширить спектр изучаемых заболеваний, увеличить справочную библиотеку известных профилей экспрессии генов и создать систему поддержки клинических решений, которая позволит онкологам всего мира скачивать содержащуюся в базе данных информацию и сопоставлять ее с результатами анализа собственных образцов. В будущем расчеты будут осуществляться с помощью caGrid – открытой инфраструктуры программных средств, разрабатываемой в качестве основной сетевой структуры финансируемой Национальным объединением компьютерной индустрии (National Computing Industries, NCI) программы онкологической Биомедицинской вычислительной сети (cancer Biomedical Informatics Grid, caBIG). Кроме того, компания IBM выделяет новому Центру высокопроизводительного анализа данных CINJ быстродействующий суперкомпьютер для обработки информации, содержащейся в оцифрованных архивах образцов опухолевой ткани и геномных данных.

По словам Джоэля Зальтца (Joel Saltz), профессора кафедры биомедицинской информатики и кафедры вычислительной техники и конструирования университета штата Огайо, специалистами которого разработана бОльшая часть программного обеспечения caGrid, одной из основных задач проекта является разработка совместимой с caGrid инфраструктуры, позволяющей интегрировать и сопоставлять данные о тканевых микрочипах и виртуальных образцах с данными, полученными при проведении различных экспериментов.

Для обеспечения совместимости разных наборов данных необходимы механизмы стандартизации использования биологических терминов и перевода сложных структур данных, получаемых при проведении различных экспериментов, в язык XML. Инфраструктура caGrid предназначена для объединения баз данных и вычислительных процедур во всемирную среду программирования. Однако для полноценного использования возможностей этой среды потенциальным пользователям необходимо хорошо ориентироваться в названиях процедур и владеть языком запросов. Над решением этих вопросов и работает группа профессора Зальтца, занимающаяся разработкой стандартных моделей данных и системы формализованных определений биомедицинских понятий, согласованных с процессами caBIG и позволяющих избегать формирования изолированных «островков информации».

Сложность и масштабность работы обусловила необходимость многоотраслевого сотрудничества большого количества организаций. В планы на ближайший год входит создание работающего прототипа системы, доступной для использования специалистам университетов штатов Аризона, Пенсильвания и Огайо, университета Ратджерса (г. Нью-Брансуик, штат Нью-Джерси) и Онкологического института Нью-Джерси. Эта система станет своего рода испытательным стендом для непрерывного усовершенствования и доработки программного обеспечения – этапа, на который исполнители работы отвели 3 года. Форан заявляет, что на четвертом году работы они надеются предоставить научным и клиническим сообществам мира завершенный и доступный к использованию программный продукт.

А пока разрабатывается caGrid, любой желающий может предоставить неиспользуемые ресурсы своего ПК на другие программы распределенных вычислений – например, в сети BOINC (Berkeley Open Infrastructure for Network Computing) с удобным, в том числе и русским, интерфейсом.

Портал «Вечная молодость» www.vechnayamolodost.ru по материалам Bio-IT World

18.02.2008

Нашли опечатку? Выделите её и нажмите ctrl + enter Версия для печати