Arc Institute создали 1-ю ИИ-модель виртуальной клетки для открытия лекарств.

(часть I).

Институт Arc (Arc Institute) запустил свою первую виртуальную клеточную модель Virtual Cell (VCell) «State», предназначенную для прогнозирования изменений экспрессии генов в ответ на химические, генетические или цитокиновые воздействия на различные типы клеток.

Модель общедоступна для некоммерческого использования и обучена на данных наблюдений за почти 170 миллионами клеток и данных о воздействиях на более чем 100 миллионов клеток в 70 линиях клеток человека, что делает ее крупнейшей на сегодняшний день моделью воздействия на отдельные клетки.

Virtual Cell (VCell) – это программная платформа с открытым исходным кодом для моделирования и симуляции живых организмов, в первую очередь клеток. Она была разработана как инструмент для широкого круга учёных, от экспериментальных клеточных биологов до биофизиков-теоретиков.

Virtual Cell предназначена для моделирования и симуляции кинетики реакций, мембранного транспорта и диффузии в сложных геометрических формах клеток и многоклеточных тканей. Модели VCell имеют иерархическую древовидную структуру. Основной уровень – это «физиология», состоящая из компартментов, видов и химических реакций, а также скоростей реакций, которые являются функциями концентраций. Зная начальные концентрации видов, VCell может рассчитать, как эти концентрации изменяются с течением времени. То, как выполняется это численное моделирование, определяется с помощью ряда «Приложений», которые определяют, будет ли моделирование детерминированным или стохастическим, пространственным или секционированным. Многочисленные «Приложения» также могут определять начальные концентрации, коэффициенты диффузии, скорости потока и различные допущения при моделировании. Таким образом, «Приложения» можно рассматривать как вычислительные эксперименты для проверки идей о физиологической системе. Каждому «Приложению» соответствует математическое описание, которое автоматически переводится на язык математического описания VCell. Несколько симуляций, включая проверку параметров и изменения в спецификациях решателя, можно запускать в рамках каждого «приложения».

Модели могут варьироваться от простых до очень сложных и представлять собой сочетание экспериментальных данных и чисто теоретических предположений.

Виртуальную клетку можно использовать как распределённое приложение через Интернет или как автономное приложение. Графический пользовательский интерфейс позволяет создавать сложные модели в биологически значимых терминах: размеры и форма компартментов, молекулярные характеристики и параметры взаимодействия. VCell преобразует биологическое описание в эквивалентную математическую систему дифференциальных уравнений. Пользователи могут переключаться между схематическим биологическим представлением и математическим представлением в общем графическом интерфейсе. При желании пользователи могут работать непосредственно с математическим описанием, минуя схематическое представление. VCell позволяет пользователям выбирать численные решатели для преобразования математического описания в программный код, который выполняется для проведения моделирования. Результаты могут отображаться в режиме реального времени или загружаться на компьютер пользователя в различных форматах экспорта. Лицензия Virtual Cell обеспечивает бесплатный доступ для всех членов научного сообщества.

Пользователи могут сохранять свои модели в базе данных VCell, которая поддерживается на серверах Университета Коннектикута. База данных VCell использует систему контроля доступа с разрешениями, которые позволяют пользователям сохранять свои модели в тайне, делиться ими с избранными коллегами или делать их общедоступными. На веб-сайте VCell есть список моделей с возможностью поиска, которые являются общедоступными и связаны с исследовательскими публикациями.

Модель State состоит из двух основных модулей:

State Embedding (Встраивание) (SE), модуль кодирования клеточного состояния. Этот модуль преобразует транскриптомы в гладкое векторное пространство для надежного сравнения между типами клеток.

State Transition (Переход) (ST) — модуль прогнозирования изменений. Это двунаправленный преобразователь, моделирующий, как возмущения изменяют профиль экспрессии генов в клетке в этом латентном пространстве.

В основе архитектуры лежит трансформерная технология с механизмом внимания (attention mechanism), что позволяет модели эффективно обрабатывать сложные биологические взаимосвязи.

Модель превзошла существующие вычислительные алгоритмы в тестовых испытаниях. На наборе данных Tahoe-100M (опубликованном Vevo/Tahoe Therapeutics в феврале этого года) State улучшила распознавание эффектов возмущений на 50% и удвоила точность определения истинно экспрессирующихся генов по сравнению с предыдущими моделями. По данным Arc, это также первая модель в данной области, которая стабильно превосходит по производительности простые линейные методы.

State — ИИ-модель, которая предсказывает, как клетки изменятся после воздействия лекарств или генетических модификаций.

Уникальность этой модели в том, что она:

• Учится сама на реальных данных;

• Может предсказывать неизвестные эффекты;

• Работает с полной сложностью (комплексностью) живых клеток;

• Не требует понимания всех механизмов.

 

Этот проект является частью Arc Virtual Cell Atlas, который объединяет данные более чем 300 млн. клеток. Модель доступна через платформу Cell-Eval для научного сообщества.

Модель разработана Arc Institute

State:

  • - обучена на 170 млн. клеток наблюдательных данных;
  • - Более 100 млн. клеток пертурбационных данных из 70 клеточных линий;
  • - Крупнейший датасет в области на сегодня;
  • - Использует трансформерную архитектуру с механизмом внимания.

Встраивание состояний улучшает прогнозирование эффекта возмущения с нулевым количеством примеров в различных наборах данных, экспериментах и модальностях. (A) Модель встраивания состояний (SE) изучает богатые, обобщаемые представления транскриптомической информации в различных наборах данных. На основе контрольной (невозмущенной) популяции клеток SE вычисляет встраивание клеток. Затем ST предсказывает, как эти встраивания меняются в ответ на заданное возмущение, эффективно моделируя эффект возмущения в латентном пространстве. Наконец, обученный декодер преобразует прогнозируемые векторы обратно в пространство экспрессии генов.

Это первая модель, стабильно превосходящая линейные базовые методы. Она успешно протестирована на препаратах, одобренных FDA, и показывает высокую специфичность для разных типов клеток.

Это достижение может значительно ускорить разработку новых лекарственных препаратов, сократив время и расходы на доклинические исследования, а также повысив эффективность выявления потенциально успешных кандидатов среди экспериментальных соединений.

*** 

Агс Research Institute — это независимый некоммерческий научно-исследовательский институт, расположенный в Калифорнии. Его основная цель заключается в ускорении научного прогресса и изучении фундаментальных причин сложных заболеваний. Институт использует инновационную модель исследований, которая предоставляет ученым полную свободу для изучения направлений, основанных на их любознательности, и одновременно способствует глубокому междисциплинарному сотрудничеству.

 В 2022 году жених-миллиардер частной исследовательницы из престижного университета сделал ей щедрое пожертвование в размере 500 миллионов долларов. Это позволило ей избежать хлопот, связанных с подачей заявок на проекты, и нанять 150 ученых, чтобы полностью сосредоточиться на научных исследованиях.

Эту женщину-инженера зовут Сильвана Конерманн (Silvana Konermann). Она имеет докторскую степень в области нейробиологии от Массачусетского технологического института (MIT) и ранее работала в лаборатории известного специалиста по CRISPR Фэн Чжана (Feng Zhang).

Патрик Коллисон (Patrick Collison) — жених-миллиардер (сооснователь Arc Institute) и один из самых молодых миллиардеров в мире, самостоятельно заработавших свое состояние. В 20 лет он бросил учебу в Массачусетском технологическом институте и основал технологическую компанию Stripe, одним из первых инвесторов которой стал Илон Маск. Сегодня в Stripe работают тысячи сотрудников по всему миру.

Патрик Сю (Patrick Hsu), один из основателей Arc Institute, получил степень бакалавра по молекулярной и клеточной биологии в Калифорнийском университете в Беркли в 2010 году. Затем он продолжил обучение в Гарвардском университете, где получил степень магистра по биологии и докторскую степень по биохимии, завершив докторантуру всего за один год. Будучи первым аспирантом Чжан Фэна, он внес значительный вклад в ранние исследования и разработки технологии CRISPR-Cas9.

В декабре 2021 года Патрик Сю вместе с друзьями Патриком Коллисоном и Сильваной Конерманн основали Arc Institute. Это хорошо финансируемое учреждение, которое ценит научную свободу.

Подписываться

Хотите быть в курсе всех новостей из мира биотехнологий, открытий в медицине и перспектив продления жизни и бессмертия?


https://t.me/kriorus_official