Bestfilez.net - новости мира Hi-tech
30.10.20  
Новости Hi-tech
Новости :: Наука и техника
Ученые исследуют РНК с помощью обучающихся сенсоров для диагностики COVID-19.
Геном - это генетический код, определяющий характеристики организма. Дезоксирибонуклеиновая кислота (ДНК), и обычно в случае вирусов, рибонуклеиновая кислота (РНК) являются строительными блоками геномных последовательностей. И манипулирование этими нуклеиновыми кислотами напрямую может привести к ощутимым изменениям в организме.
Таким образом, развитие генной инженерии сфокусировано на нашей способности манипулировать геномными секвенциями. Но это сложная задача. Например, точное управление определенным классом инженерных молекул РНК, называемых "переключателями", может дать жизненно важное представление о клеточной среде и потенциальных заболеваниях.




Однако предыдущие эксперименты показали, что переключатели не поддаются отслеживанию, многие из них не реагируют на изменения, даже если они были спроектированы для получения желаемого выхода в ответ на заданный вход на основе известных правил складывания РНК.

Учитывая это, две команды исследователей из Института Вайсса при Гарвардском университете и Массачусетском технологическом институте (MIT) разработали набор алгоритмов машинного обучения, которые могут улучшить этот процесс. В частности, они использовали глубокое обучение для анализа большого количества последовательностей переключения тел, чтобы точно предсказать, какие теллы надежно выполняют поставленные перед ними задачи, тем самым позволяя исследователям выявлять высококачественные теллы для своих экспериментов. Их результаты были опубликованы сегодня в журнале "Природа" в двух отдельных статьях.

При любой проблеме машинного обучения первым шагом является сбор специфических для данной области данных для обучения модели. Исследователи собрали большой набор данных, состоящий из последовательностей переключателей. Алекс Гаррусс, первый автор и аспирант, работающий в Вайсе, заявил:

"Мы спроектировали и синтезировали огромную библиотеку переключателей, в общей сложности почти 100 000, путем систематической выборки коротких триггерных областей вдоль всех геномов 23 вирусов и 906 транскрипционных факторов человека".



Поскольку существовало две отдельные команды, исследователи пробовали свои силы в решении этой проблемы двумя разными методами. Авторы первой статьи решили проанализировать не последовательность базисов, а двумерные образы возможностей пар базисов. Этот подход, названный Visualizing Secondary Structure Saliency Maps, или VIS4Map, успешно выявил физические элементы переключателей Toehold, которые повлияли на их производительность, предоставив представление о механизмах складывания РНК, которые не были обнаружены с использованием традиционных методов анализа.

После генерации набора данных, состоящего из тысяч переключателей, одна команда использовала алгоритм, основанный на компьютерном видении, для анализа последовательностей в виде двумерных изображений, в то время как другая команда использовала естественную языковую обработку для интерпретации последовательностей в виде "слов", написанных на "языке" РНК. Изображение через Институт Вайсса при Гарвардском университете
Авторы второй статьи создали две различные архитектуры глубокого обучения, которые подошли к проблеме определения "восприимчивых" переключателей с использованием ортогональных техник. Первая модель была основана на использовании конволюционной нейронной сети (CNN) и многослойного перцептрона (MLP), которые рассматривают тыловые последовательности как 1D-образы, или линии оснований нуклеотидов. С помощью метода оптимизации, названного Sequence-based Toehold Optimization and Redesign Model (STORM), были выявлены закономерности расположения оснований и потенциальные взаимодействия между этими основаниями для обозначения интересующих их тел.

Вторая архитектура моделировала задачу в области обработки естественного языка (NLP), рассматривая каждую последовательность Toehold как фразу, состоящую из шаблонов слов. Затем задача состояла в том, чтобы подготовить модель для объединения этих слов, или нуклеотидных оснований, для создания когерентной фразы. Эта модель была интегрирована с моделью, основанной на CNN, для создания нуклеиновой кислотной речи (NuSpeak). Этот метод оптимизации переработал последние девять нуклеотидов данного переключателя, сохранив при этом оставшиеся 21 нуклеотид. Это позволило создать специализированные тележки, которые обнаруживают наличие специфических патогенных последовательностей РНК и могут быть использованы для разработки новых диагностических тестов.

Для тестирования обеих моделей исследователи обнаружили фрагменты SARS-CoV-2, вирусного генома, вызывающего COVID-19, с помощью оптимизированных переключателей. NuSpeak улучшил производительность датчиков в среднем на 160%. С другой стороны, STORM создал лучшие версии четырех датчиков вирусной РНК SARS-CoV-2, улучшив их производительность до 28 раз. Об этих впечатляющих результатах рассказала соавтор второй статьи Кэти Коллинз, студентка Массачусетского технологического института (MIT) в Институте Вайсса:

"Реальным преимуществом платформ STORM и NuSpeak является то, что они позволяют быстро проектировать и оптимизировать компоненты синтетической биологии, как мы показали на примере разработки сенсоров для диагностики COVID-19".

Диого Камачо (Diogo Camacho), автор второй статьи и старший ученый в области биоинформатики, со-руководитель Инициативы по превентивной био-аналитике в Институте Вайсса, заявил:

"Пожалуй, наиболее важным аспектом инструментов, которые мы разработали в этих работах, является то, что они являются обобщающими для других типов последовательностей на основе РНК, таких как индуцибельные промоторы и естественные рибосвитчи, и, следовательно, могут быть применены к широкому спектру проблем и возможностей в биотехнологии и медицине".

Двигаясь вперед, как и предполагал Камачо, команды стремятся обобщить свои алгоритмы, чтобы нанести их на карту других проблем в синтетической биологии для потенциального ускорения развития инструментов биотехнологии.

Источник: https://www.neowin.net/news/researchers-probe-into-rna-using-deep-learning-to-develop-sensors-for-a-covid-19-diagnostic


Опубликовано 07.10.20

Яндекс.Метрика
Сайт сделан на SiNG cms © 2010-2020