«Умный фильтр для ДНК»: Ученый рассказал, как нейросети ищут поломки в генах

Ученый Грызунов: нейросети ищут поломки в генах и возможные болезни
Фото: iStock/Shutter2U

Наш геном — это не только гены, которые кодируют белки. Лишь малая часть ДНК содержит «инструкции» по сборке белков. Остальное — сложная система регуляторных переключателей, которая решает, когда и в каких клетках включится тот или иной ген. Мутации в этих переключателях не менее опасны, чем поломки в самих генах, но предсказывать их гораздо сложнее.



Аспирант Института белка РАН из Пущина Никита Грызунов в беседе с «Радио 1» заявил, что в человеческом геноме закодировано гораздо больше информации, чем просто последовательности аминокислот для белков. Около 98% нашей ДНК — это не «мусор», а сложнейшая панель управления. Поломки в этой системе часто страшнее мутаций в самих генах, но обнаружить их традиционными методами почти невозможно.

«Сами гены, их кодирующая часть, занимают мизерную долю. Большая доля приходится на некодирующую ДНК, которая работает как сложная система переключателей. Она определяет, как, где и когда активизируется каждый ген. Главная трудность в том, что один и тот же регуляторный участок может быть критичен для сердца, но абсолютно бесполезен для печени», — объяснил он.

По словам ученого, нейросети работают как «умные фильтры». Они основаны на алгоритмах распознавания изображений и ищут в ДНК не случайные буквы, а особые паттерны — посадочные площадки для белков, управляющих генами. Из миллионов генетических вариантов нейросеть отбирает лишь те, которые действительно могут привести к болезни.

«Мы приоритизируем наиболее вероятные варианты, которые, по мнению нейросети, важны именно в конкретной ткани. Чтобы проверить, не ошибается ли алгоритм, его тестируют на данных, скрытых во время обучения. Например, нейросеть «не видит» целую хромосому, а потом должна предсказать эффекты мутаций на ней. Нельзя верить нейросети на слово. Мы скрываем от нейросети часть данных, а потом просим сделать предсказания и оцениваем качество», — уточнил разработчик.

Он добавил, что особенно ценна разработка для изучения энхансеропатий — болезней, вызванных утратой целых регуляторных участков. Алгоритм не просто находит опасную зону, но и показывает молекулярный механизм поломки. При этом нейросети не заменяют классическую генетику, а работают с ней в симбиозе. Однако до применения в больницах — десятилетия. Биология регуляторных участков слишком сложна: эффект мутации зависит от ткани и от уникального генома пациента.

«Одна и та же мутация в разных тканях проявляет себя по-разному. На эффект влияет уникальный геном конкретного пациента. Нужны новые экспериментальные методы и данные о сотнях тысяч мутаций. Пока технологии не станут рутинными, нейросети останутся инструментом исследователей. Это горизонт 20–30 лет», — заключил Грызунов.

Что думаешь?

0 0 0 0 0 0