Машинное обучение поможет экономить на производстве лекарств

CNews
Машинное обучение поможет экономить на производстве лекарств

Система предсказывает 72% реакций

Специальная компьютерная система, способная предугадывать результаты химических реакций, поможет западным специалистам наиболее дешевым способам получать те или иные химические соединения. В основу разработки ученых Массачусетского технологического института (МТИ) заложены принципы машинного обучения.

После того, как химики-органики получат определенное вещество, инженеры подбирают последовательности реакций, которые могут привести к его производству в промышленных масштабах. Сейчас этот труд преимущественно ручной, а ведь подобных реакций может быть сотни. Некоторые из них используют более дешевые реагенты и протекают при низких температурах, что приводит к ощутимой экономии. Разработанная в МТИ компьютерная система обучается тысячам примеров эмпирических реакций и на основе своего опыта может определять более экономные химические цепочки. В проведенных тестах система смогла предсказать основной продукт реакции в 72% случаев.

Атомы одного вещества могут взаимодействовать с атомами другого на любых участках молекул. Это делает прогнозы особенно сложными

«Конечно, сегодня мы уже многое знаем о протекании химических реакций, — говорит один из авторов исследования Клавс Йенсен (Klavs Jensen). — Но для того, чтобы посмотреть на готовую молекулу вещества и принять решение, как именно вы ее будете синтезировать, необходимы исключительные навыки. Наша итоговая разработка будет выглядеть так: вы подходите к системе и говорите: «Я хочу получить такую молекулу». И машина показывает вам, как этого добиться».

Имеющийся показатель эффективности в 72% пока не позволяет полностью отдать синтез на откуп машинам. Но даже сейчас процесс стал гораздо проще: после обработки данных системой химики имеют некий ограниченный набор наиболее вероятных последовательностей реакций.

Фармацевтам будет проще создавать препараты

Химики МТИ говорят, что одна органическая молекула, необходимая, например, для производства лекарств, может состоять из десятков или даже сотен атомов. Но реакция между двумя такими молекулами может затрагивать только несколько атомов, входящих в их состав.

Таким образом, системе необходимо держать под контролем и просчитывать тысячи взаимодействий между сотнями различных реагентов, которые зачастую вступают в реакции непредсказуемым для человека образом: той или иной последовательностью атомов на так называемых «реакционных участках». Именно точное прогнозирование таких участков делает работу химиков крайне трудоемкой.

Раньше инженеры строили частные компьютерные модели, которые пытались предсказывать расположение и последствия взаимодействия на реакционных участках. Но подобный анализ требовал широкого списка исключений, уникальных для каждого из реагентов в каждой из возможных сред. Кодировать эти исключения приходилось вручную, а их число нередко достигало десятков. Причем открытие каждого исключения приравнивалось к небольшому научному открытию, достойному отдельной публикации.

В изобретенной системе все эти функции взял на себя искусственный интеллект. На основе имеющихся в распоряжении ученых патентов была сгенерирован список описаний уже известных реакций. С помощью нейронной сети система ранжирует их в порядке вероятности и просчитывает еще неизученные сочетания. Таким образом, удалось составить иерархия вероятность тех или иных взаимодействий на реакционных участках.

По словам представителей западных фармацевтических компаний, предложенная учеными из МТИ система предлагает уникальный подход к компьютерному обучению в области целевого синтеза. В будущем он может трансформировать существующую практику экспериментального проектирования препаратов в относительно простой машинный способ получения целевых молекул.