Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • Биомолтекст2020
  • vsh25
  • Vitacoin

Геном в формате mp3

Математики придумали архиватор для ДНК

Лента.ру

Математики из Массачусетского технологического института предложили новый способ хранения и обработки данных о последовательностях ДНК. Он должен помочь справиться с наплывом данных от все большего числа прочитанных геномов. Работа с описанием нового алгоритма (Loh et al., Compressive genomics) опубликована в журнале Nature Biotechnology, а ее краткое содержание (Searching genomic data faster) можно прочитать на сайте института.

Алгоритм основан на том, что последовательности ДНК между всеми организмами в той или иной степени схожи, а наибольший интерес для ученых представляют различия. Поэтому, по словам авторов, хранить и обрабатывать следует не сами последовательности, а их отличия друг от друга.

Если, например, поиск определенной последовательности в геноме некоторого организма уже проводился, то поиск той же последовательности в новом геноме следует проводить не по всей последовательности, а только в тех местах, где новый геном отличается от старого. Это позволяет существенно снизить время поиска последовательностей и нагрузку на вычислительные центры. Разница в длительности вычислений между старым и новым алгоритмом зависит от количества уже прочитанных геномов – чем их больше, чем труднее искать по-старому и тем очевиднее преимущества нового алгоритма.

Упор на поиск различий в близких геномах соответствует современному развитию биологии. С одной стороны, в последнее десятилетие резко уменьшается стоимость секвенирования.


Скорость роста вычислительных мощностей компьютеров (зеленый)
и новых последовательностей ДНК. Изображение из статьи Loh et al.

Из-за этого скорость роста данных о последовательностях ДНК уже превышает экспоненциальную. С другой стороны, по мере увеличения количества прочитанных геномов доля совершенно уникальных последовательностей уменьшается. Прочитанные геномы все больше походят друг на друга. Например, в ближайшее время биоинформатики ожидают массового наплыва данных от проектов по секвенированию ДНК тысяч отдельно взятых людей, позвоночных, насекомых.

Портал «Вечная молодость» http://vechnayamolodost.ru
12.07.2012

Читать статьи по темам:

анализ ДНК база данных биоинформатика компьютеры секвенирование генома Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

Криминальная геномика

Обязательная геномная регистрация неопознанных тел введена в России, соответствующий документ опубликован на сайте Кремля во вторник.

читать

ДНК за решеткой

В России начинается создание единой базы ДНК всех особо опасных преступников. Регистрацию этих данных узаконила Государственная Дума, однако пока не ясно, кто и как будет собирать ДНК заключенных.

читать

Маньяка нашли по базам данных ДНК

Полицейские подняли 16 тысяч уголовных дел, связанных с преступлениями сексуального характера, и сравнили образцы ДНК подозреваемых с национальным банком данных, в котором содержатся сведения о ДНК 6 млн человек.

читать

В России создается база генных паспортов

Госдума узаконила введение в стране государственной геномной регистрации. В МВД считают, что это повысит эффективность борьбы с преступностью.

читать

Новые «гены остеоартроза»

Ученым из университета Ньюкасла удалось выделить восемь новых участков ДНК, отвечающих за развитие остеоартроза. Ранее были определены три ответственных за остеоартроз участка генетического кода.

читать

Геномика: время больших ожиданий

Энтузиасты индивидуальной геномики обещают море возможностей по предсказанию рисков развития болезней и особенностей лечения. Но они умалчивают о том, что сама эта связь вовсе не является доказанной для многих болезней.

читать