Новый метод поиска генов, которые стимулируют рост опухоли, использует преимущества алгоритмов машинного обучения для анализа множества молекулярных данных, собранных из исследований раковых клеточных линий, мышиных моделей и у пациентов. Результаты исследования опубликованы в научном журнале Scientific Reports.
Материалы и методы обследования
В новом исследовании ученые во главе с автором исследования Робертом Хендорфом (Robert Hoehndorf) из Исследовательского центра вычислительной биологии Научно-технологического университета имени короля Абдаллы (KAUST’s Computational Bioscience Research Center) обучили систему искусственного интеллекта (ИИ) связывать определенные мутации ДНК с измененной функциональностью. Традиционно ученые приступили к поиску генов, которые играют роль в возникновении рака, начав с данных о последовательности ДНК путем обширной каталогизации опухолевых мутаций, распространенных среди пациентов с распространенным типом рака. Ученые создали модель машинного обучения, которая учитывает многие биологические особенности генов и путей, участвующих в образовании опухоли.
Затем исследователи дополнительно проверили эффективность алгоритма на молекулярных данных, собранных у двух групп больных раком. Первая группа была из университетской больницы им. Короля Абдель Азиза (King Abdulaziz University Hospital in Saudi Arabia) в Саудовской Аравии, в которую вошли 26 образцов опухолей от людей с карциномой носоглотки. Другая когорта включала 114 образцов колоректального рака от пациентов, проходивших лечение в клинике Университета Бирмингема (Birmingham Hospital) в Соединенном Королевстве.
Результаты научной работы
Ученые показали, что могут идентифицировать гены с известной причинной ролью в развитии рака и выбрать десятки предполагаемых новых генов для 20 различных типов опухолей. Метод прогнозирования — описанный в научных работах и свободно доступный в Интернете — может помочь клиницистам адаптировать лекарственные препараты к молекулярным подтипам рака у пациентов. Метод прогнозирования также может быть использован фармацевтическими компаниями в поисках новых терапевтических целей.
«Наш метод может использоваться в качестве основы для прогнозирования и анализа генов, вызывающих рак, в любой базе данных или в реальной выборке населения», — объясняет соавтор исследования Сара Альтубаити (Sara Althubaiti).
Исследователи зарегистрировали сотни генов, которые влияют на развитие опухолей. Экспериментальное наблюдение затем используется для функциональной связи этих генов с признаками рака.
Исследователи разработали алгоритм для распознавания функциональных и фенотипических паттернов, которые предрасполагают ген к участию в развитии опухоли. Ученые подтвердили правильность модели, используя общедоступную базу данных о 27000 различных вариантов опухолей, показав, что алгоритм может точно классифицировать известные гены, вызывающие рак, и обнаружить более 100 других вероятных виновников, многие из которых имеют конкретные роли в развитии подтипов опухолей. В обеих группах пациентов модель выделяла гены, которые часто мутировали, и разделяла патогенные признаки других генов, вызывающих рак.
Авторы другого исследования утверждают, что гены HNF4A и HNF4G отвечают за развитие рака кишечника.