Представлены первые результаты работы над полным атласом клеток человека
Международный исследовательский консорциум представил первые результаты работы над черновым вариантом полного атласа всех человеческих клеток на всех этапах развития. Они включают концепцию проекта, используемые аналитические подходы и атласы отдельных органов. Посвященные этому публикации собраны в коллекцию журнала Nature, она продолжает пополняться.
Понимание того, как функционируют клетки организма в норме и при заболеваниях, важно в различных областях — от фундаментальной биологии до практической медицины. К настоящему времени картировано более 100 тысяч генетических вариантов, связанных с заболеваниями, однако в целом остается неизвестным, в каких клетках они активны и какие функции выполняют. При этом в организме человека, по оценкам, содержится 37,2 триллиона клеток различных типов и в различном состоянии, и на них влияет множество индивидуальных факторов, таких как происхождение, географическое положение, возраст, пол и многообразие пережитых событий.
Для выполнения амбициозной задачи по созданию современных референсных карт всех человеческих клеток в 2016 году был создан международный консорциум Human Cell Atlas (HCA), призванный использовать с этой целью достижения молекулярных исследований и машинного обучения. Открытую облачную платформу для него разработали сотрудники Европейского института биоинформатики, Броудовского института, фонда «Инициатива Чан — Цукерберга» и Калифорнийского университета в Санта-Крузе. В настоящее время в нем участвуют более 3600 исследователей из 102 стран, за время существования проекта они обработали данные более 100 миллионов клеток, полученных более чем у десяти тысяч людей.
После начального планирования члены HCA занялись сбором имеющейся информации по молекулярным профилям отдельных клеток, в основном транскриптомным, но также эпигеномным, протеомным и метаболомным. Для ее обработки исследователи консорциума разработали три модели на основе алгоритмов машинного обучения. Одна из них — popV — предназначена для классифицирования типов клеток путем переноса их меток из аннотированных атласов на неаннотированные датасеты. Другая — scTab — определяет типы клеток в различных тканях по данным секвенирования РНК отдельных клеток. Третья — MultiDGD — интегрирует мультимодальные данные, такие как экспрессия генов и доступность хроматина для транскрипции.
Сейчас HCA завершил первичный сбор данных и приступил к их интеграции для создания первого черновика атласа. В установочной статье создатели и сопредседатели консорциума Сара Тайхманн (Sarah Teichmann) из Кембриджского института стволовых клеток и Авив Регев (Aviv Regev) из биотехнологической компании Genentech с коллегами изложили свое видение развития атласа, состоящего из пяти этапов: как простой переписи клеток, как их масштабируемой трехмерной карты в структуре тканей и органов, как карты их трансформации в процессе развития (от эмбрионального до старения), как карты взаимовлияния генотипа и фенотипа с учетом людей разных этнических групп и происхождения и, наконец, как объединенной мультимодальной базовой модели, интегрирующей все эти уровни — по выражению авторов, аналога Google Maps для клеточной биологии.
В сопутствующих статьях члены 18 отдельных биологических сетей HCA описали результаты уже выполненных работ над отдельными частями атласа. Они включают атлас клеток кишечника в норме и при воспалении, атлас органоидов мозга на разных этапах развития, пространственный атлас клеток тимуса (вилочковой железы), мультиомный атлас плаценты с молекулярным разрешением, атлас внутриутробного развития скелета и пространственный клеточный атлас легких при фатальном ковиде у представителей черного африканского населения. Отдельная публикация посвящена этической стороне обработки данных — как сделать их максимально общедоступными и открытыми при различных путях получения (у живых людей, трупов, детей, представителей разных культур и этносов, на разных этапах развития и так далее).
Исследователи подчеркивают, что несмотря на революцию разрешающей способности генетических и молекулярных исследований и прогресс в области машинного обучения, работа над созданием атласа, позволяющего исследовать сложные механистические и функциональные аспекты биологии, будет очень непростой и потребует помимо прочего множественных экспериментов по внесению помех в нормальное функционирование клеток.