Алгоритм универсален — он может выявлять закономерности на любом масштабе и во много раз ускорять научные открытия.
Исследователи из Мичиганского университета создали искусственный интеллект, который помогает наблюдать поведение отдельных молекул за считанные часы, и в перспективе сможет отслеживать движение частиц, животных и небесных тел. Результаты их работы опубликованы в Nature Methods.
Наблюдение за молекулами в реальном времени
Понимание поведения одной молекулы критично для биологии и медицины. Например, оно помогает выяснять, как клетки регулируют свои процессы, и выявлять сбои, вызывающие заболевания. Для этого молекулы помечают флуорофорами — специальными метками, которые светятся под лазером. С помощью микроскопов исследователи могут наблюдать за их движением, но наборы данных огромны, и анализ вручную занимает недели или месяцы.
Чтобы решить эту проблему, команда под руководством Нильса Вальтера создала систему META-SiM. В отличие от специализированных моделей ИИ, которые решают одну задачу, META-SiM является базовой моделью, обученной на миллионах смоделированных следов молекул. Она способна находить интересные закономерности в больших массивах данных и выявлять необычные паттерны, требующие внимания ученых.
«Идея в том, чтобы переходить от отдельных молекул к более крупным масштабам. Данные похожи друг на друга, и алгоритм способен обнаруживать эти сходства и любые отклонения», — говорит Вальтер.
«Мы могли бы отслеживать, например, миграцию антилоп гну в Африке или движение астероидов в Солнечной системе».
META-SiM уже ускоряет анализ молекул. Александр Джонсон-Бак, соавтор исследования, сравнивает процесс с поиском крошечного персонажа на огромной картине, где вокруг него тысячи почти одинаковых фигур:
«Анализ данных микроскопии похож на нахождение этого персонажа среди множества похожих объектов, только страниц может быть десятки, а персонажей — несколько. META-SiM подсказывает, где искать».
Применение в изучении генетических заболеваний
Особое значение инструмент имеет для изучения генетических заболеваний. В клетках гены соединяются в РНК, которая затем синтезирует белки. Ошибки слияния, возникающие при сборке информации из ДНК, встречаются у 60% наследственных заболеваний. META-SiM может обнаруживать редкие ошибки в процессе сборки генетической информации, которые приводят к неправильной работе РНК и белков, что открывает путь к поиску методов лечения.
Работа системы сосредоточена на изменении сигнала флуорофоров с течением времени, отражающем различные состояния молекул. Это позволяет выявлять закономерности, которые человек мог бы упустить. Модель обучалась на миллионах симуляций, отражающих разнообразное поведение молекул в лабораторных условиях, что делает ее универсальной и масштабируемой.
Кроме биологии, META-SiM может работать с другими данными, где объекты движутся по времени: диффузия отдельных частиц, миграция животных или движение небесных тел.
«Алгоритм универсален — он может выявлять закономерности на любом масштабе. Он может отслеживать все что движется», — говорит Вальтер.
Ускорение научных открытий
Новый ИИ не заменяет ученого, но значительно ускоряет процесс. Вместо месяцев анализа исследователи могут за ночь выявлять ключевые паттерны и сосредоточиться на их интерпретации.
«Все равно нужен эксперт, чтобы поставить результаты в контекст, но процесс исследования становится намного эффективнее», — добавляет Джонсон-Бак.
Искусственный интеллект META-SiM открывает новый уровень анализа биологических систем, позволяя изучать молекулы в деталях, ускорять открытия и потенциально применять те же алгоритмы для изучения явлений в других областях — от экологии до астрономии.