Подписаться на новости
  • Сенатор
  • ООО "Ай Вао"
  • vsh25
  • Vitacoin

«Трансформер»

Физики МГУ разработали новую модель для ускоренной разработки лекарств

Сотрудники физического факультета МГУ создали новую модель для ускоренной разработки лекарств. Модель генерирует 90% химически валидных лекарственных соединений, способных связываться с заданным белком, используя лишь его аминокислотную последовательность в качестве входных данных. Она может существенно ускорить и упростить процесс разработки лекарств. Работа опубликована в престижном журнале Scientific reports (Daria Grechishnikova, Transformer neural network for protein-specific de novo drug generation as a machine translation problem).

Разработка лекарственных препаратов – очень дорогой и долгий процесс. Он занимает в среднем 10-13 лет, а его стоимость достигает нескольких миллиардов долларов. Разработка делится на несколько этапов. Одним из наиболее важных этапов является поиск новой молекулы, способной воздействовать на белок-мишень. Это чрезвычайно сложная задача, так как количество всех химически возможных молекул огромно и составляет по разным оценкам от 1023 до 1060. К настоящему моменту синтезировано только 108 молекул. Для поиска новых структур практически всегда используют компьютерные методы.

Выделяют два основных типа вычислительных методов. Первый основывается на трёхмерной структуре белка. Если известна конфигурация сайта связывания, то можно оптимизировать структуру молекулы прямо под неё. Второй тип – это методы, основанные на информации об уже известных лигандах, связывающихся с данным белком-мишенью. Можно установить связь между физико-химическими свойствами соединения и его активностью в отношении белка и использовать это знание для создания новых структур. К сожалению, большинство существующих методов в вычислительной химии имеют тенденции к генерации сложно синтезируемых молекул. Кроме того, в основе многих методов лежат закодированные вручную правила, которые сильно ограничивают число доступных алгоритму молекул. Словом, поиск структур остается сложной задачей. В настоящее время активно исследуется возможность применения методов машинного обучения для решения задач генерации новых молекул.

«Мы использовали глубокую нейронную сеть "Трансформер". Эту архитектуру придумали исследователи из Google Brains в 2017 году для обработки естественного языка. Трансформер состоит из энкодера и декодера. Энкодер отображает входную последовательность символов в некоторый вектор. Затем декодер посимвольно генерирует на выходе последовательность, используя этот вектор. Одной из важнейших особенностей "Трансформера" являются self attention слои. Self attention – это механизм внимания, который устанавливает связи между различными участками одной и той же последовательности и на основании этой информации строит ее представление. В нашей задаче в качестве слов мы рассматриваем аминокислоты и отдельные символы строкового представления молекулы (SMILES)», – рассказала сотрудник кафедры биофизики физического факультета МГУ Дарья Гречишникова.

Self attention-слою требуется константное число последовательных операций для установления связей между любыми элементами последовательности, что позволяет ему справляется с длинными последовательностями. Этот механизм хорошо подходит для задачи перевода последовательности белка в строковое представление лиганда по двум причинам. Во-первых, аминокислотные последовательности белков могут быть достаточно длинными – в десятки раз длиннее строкового представления молекул. Во-вторых, функционально значимые элементы структуры белка могут быть образованы аминокислотными остатками, находящимися далеко друг от друга в последовательности. Поэтому важно, чтобы модель хорошо улавливала зависимости именно между удаленными элементами.

Мы впервые представили белок-специфичный дизайн лекарств как проблему перевода между «языком» аминокислот и строковым представлением молекулярной структуры (SMILES). «Белок рассматривается как “контекст” для генерации связывающейся с ним молекулы. Такая постановка задачи позволила нам адоптировать одну из самых успешных архитектур в области машинного перевода к задачам генерации молекул. Оказалось, что аминокислотной последовательности белка достаточно для того, чтобы сгенерировать молекулы, связывающиеся с заданным белком», – продолжила Дарья Гречишникова.

Разработанная модель может существенно ускорить и упростить процесс разработки лекарств. Она позволит быстро и эффективно создавать молекулы, способные взаимодействовать с конкретным белком. Опубликованные ранее модели требуют данные об известных молекулах, связывающихся с белком, или информацию о его трехмерной структуре. Однако для новых белков-мишеней для получения такой информации необходимо привлекать дополнительные методы. «Так, например, для новых белков, таких как вирусные белки SARS-CoV-2, вызывающие инфекционное заболевание COVID-19, данные по аффинности связывания с какими-либо соединениями отсутствовали. В таком случае, скорее всего не удастся применить подходы, использующие дообучение модели на связывающихся с белком молекулах. Подходы, основанные на структуре белка, также могут быть неприменимы, так как для некоторых белков определение трехмерной структуры затруднено или даже невозможно. Предложенная модель требует лишь знание аминокислотной последовательности белка, что значительно упрощает задачу поиска молекул», – добавила Дарья Гречишникова.

Портал «Вечная молодость» http://vechnayamolodost.ru


Читать статьи по темам:

разработка препаратов компьютеры Версия для печати
Ошибка в тексте?
Выдели ее и нажми ctrl + enter
назад

Читать также:

ИИ нашел новое лекарство

Исследователи из Массачусетского технологического института при помощи искусственного интеллекта обнаружили мощный антибиотик.

читать

Не хуже антител

Разработанный с помощью компьютера белок плотно соединяется с шиповидными отростками коронавируса и мешает ему инфицировать клетки.

читать

Антибиотик из машины

Используя алгоритм машинного обучения, исследователи Массачусетского технологического института выявили новый мощный антибиотик.

читать

In silico

Японская фармкомпания приступает к испытаниям лекарства, синтезированного с помощью искусственного интеллекта.

читать

ИИ для фармгиганта

В GSK уверены, что с помощью искусственного интеллекта и новой команды специалистов можно как минимум удвоить эффективность разработок.

читать