Ученые из Массачусетского технологического института (MIT) разработали систему искусственного интеллекта под названием DefensePredictor, которая способна за считанные минуты находить новые белки, участвующие в бактериальной иммунной защите, тогда как традиционные методы требуют на это недели или даже месяцы. В ходе первого тестирования алгоритм обнаружил более 600 белков в различных штаммах кишечной палочки Escherichia coli, которые ранее не связывались с иммунными функциями. Некоторые из этих белков, как показали лабораторные испытания, действительно защищали бактерии от атак бактериофагов — вирусов, способных уничтожать до четверти бактериальной популяции за сутки. Это свидетельствует о том, что ИИ не просто классифицирует известные системы, а выявляет функционально активные, но ранее неизвестные защитные механизмы.

Исследование основывается на фундаментальной особенности бактерий: их постоянной эволюционной борьбе с вирусами. В ответ на атаки фагов микроорганизмы разработали множество иммунных стратегий — от разрушения вирусной ДНК до сложных систем «запоминания» инфекций. Наиболее известный пример — CRISPR, который изначально был обнаружен как часть бактериальной защиты и впоследствии стал инструментом генного редактирования. Однако CRISPR — лишь одна из множества подобных систем. Ученые уже идентифицировали сотни других механизмов бактериальной защиты, но предполагается, что большая часть остается неоткрытой из-за ограничений традиционных методов поиска: многие гены распределены по геному и не образуют очевидных кластеров.

Модель DefensePredictor стремится решить эту проблему. В ее основе лежит языковая модель белков ESM-2, обученная «понимать» последовательности аминокислот так же, как большие языковые модели понимают текст. Белки рассматриваются как «последовательности из 20 букв», формирующих сложные структуры и функции. Для обучения модели исследователи MIT использовали базу данных, собранную с помощью предыдущего алгоритма DefenseFinder, включающую около 15 000 белков, связанных с иммунной защитой, и более 186 000 белков без такой функции из приблизительно 17 000 микробных геномов.

После обучения DefensePredictor проанализировал 69 штаммов E. coli и выявил более 600 потенциальных защитных белков, включая более 100 ранее совершенно неизвестных вариантов. Примечательно, что почти половина из них не располагалась рядом в геноме, что ранее считалось характерным признаком совместно работающих систем. Для проверки результатов исследователи искусственно внедрили часть найденных белков в уязвимый штамм бактерий и подвергли их атаке различных бактериофагов. Около 45% белков обеспечили защиту хотя бы от одного вируса, подтверждая их функциональную роль.

Дальнейший анализ, расширенный на более чем 1000 микробных видов, выявил тысячи дополнительных потенциальных защитных белков, ранее не описанных в научной литературе. Параллельно другая группа из Института Пастера использовала собственные ИИ-модели и предсказала около 2,4 млн потенциальных антивирусных белков в более чем 32 000 бактериальных геномов, что подчеркивает масштаб скрытого биологического разнообразия. Ученые отмечают, что бактериальные системы защиты представляют собой огромный, практически неисследованный резерв биологических механизмов. Помимо CRISPR, уже известны системы с функциями «молекулярных ножниц», «токсин-антитоксинные комплексы» и другие механизмы, которые находят применение в биотехнологии — от генной инженерии до создания биологических «выключателей» для контроля модифицированных организмов.

Однако ключевая проблема остается прежней: большинство таких систем крайне трудно обнаружить стандартными методами. Именно поэтому ИИ-подходы становятся важными — они позволяют анализировать миллионы последовательностей и выявлять функциональные закономерности, которые человек не может увидеть напрямую. По словам исследователей, итоговая цель подобных систем — не только ускорить поиск новых биологических инструментов, но и понять, как в принципе эволюционировала иммунная система микроорганизмов. В перспективе такие открытия могут привести к появлению нового поколения технологий: от более точных методов генного редактирования до принципиально новых молекулярных инструментов для медицины и синтетической биологии.

Источник

Написать комментарий