[ad_1]
Фармацевтические компании используют искусственный интеллект для оптимизации процесса открытия новых лекарств. Модели машинного обучения могут предлагать новые молекулы, обладающие особыми свойствами, которые могут бороться с определенными заболеваниями, делая за считанные минуты то, на что у людей могут уйти месяцы, чтобы достичь их вручную.
Но есть серьезное препятствие, которое сдерживает эти системы: модели часто предлагают новые молекулярные структуры, которые трудно или невозможно воспроизвести в лаборатории. Если химик не может создать молекулу, ее борющиеся с болезнями свойства невозможно проверить.
Новый подход исследователей из Массачусетского технологического института ограничивает модель машинного обучения, предлагая только те молекулярные структуры, которые можно синтезировать. Метод гарантирует, что молекулы состоят из материалов, которые можно купить, и что химические реакции, происходящие между этими материалами, следуют законам химии.
По сравнению с другими методами, их модель предлагала молекулярные структуры, которые оценивались как высокие, а иногда и лучше, согласно популярным оценкам, но гарантированно были синтезируемы. Их системе также требуется менее одной секунды, чтобы предложить путь синтеза, в то время как другие методы, которые предлагают молекулы по отдельности, а затем оценивают их способность к синтезу, могут занять несколько минут. В пространстве поиска, которое может включать миллиарды потенциальных молекул, эта экономия времени складывается.
«Этот процесс переформулирует то, как мы просим эти модели генерировать новые молекулярные структуры. Многие из этих моделей предполагают построение новых молекулярных структур атом за атомом или связь за связью. Вместо этого мы строим новые молекулы, строительный блок за строительным блоком и реакцию за реакцией», — говорит Коннор Коли, доцент Генри Слезингера по развитию карьеры на факультетах химической инженерии, электротехники и компьютерных наук Массачусетского технологического института и старший автор статьи.
К Коли в статье присоединились первый автор Вэньхао Гао, аспирант, и Росио Меркадо, постдоктор. Исследование будет представлено на этой неделе на Международной конференции по обучающим представлениям.
Строительные блоки
Чтобы создать молекулярную структуру, модель имитирует процесс синтеза молекулы, чтобы убедиться, что она может быть произведена.
Модель получает набор жизнеспособных строительных блоков, которые представляют собой химические вещества, которые можно приобрести, и список действительных химических реакций, с которыми можно работать. Эти шаблоны химических реакций изготавливаются вручную экспертами. Контроль этих входных данных путем разрешения только определенных химических веществ или конкретных реакций позволяет исследователям ограничить пространство поиска новой молекулы.
Модель использует эти входные данные для построения дерева, выбирая строительные блоки и связывая их с помощью химических реакций, по одному, чтобы построить окончательную молекулу. На каждом этапе молекула становится все более сложной по мере добавления дополнительных химических веществ и реакций.
Он выводит как окончательную молекулярную структуру, так и дерево химических веществ и реакций, которые ее синтезируют.
«Вместо непосредственного проектирования самой молекулы продукта мы разрабатываем последовательность действий для получения этой молекулы. Это позволяет нам гарантировать качество конструкции», — говорит Гао.
Чтобы обучить свою модель, исследователи вводят полную молекулярную структуру и набор строительных блоков и химических реакций, а модель учится создавать дерево, которое синтезирует молекулу. Увидев сотни тысяч примеров, модель учится самостоятельно придумывать эти синтетические пути.
Молекулярная оптимизация
Обученную модель можно использовать для оптимизации. Исследователи определяют определенные свойства, которых они хотят достичь в конечной молекуле, учитывая определенные строительные блоки и шаблоны химических реакций, и модель предлагает синтезируемую молекулярную структуру.
«Что было удивительно, так это то, что большую часть молекул можно воспроизвести с помощью такого небольшого набора шаблонов. Вам не нужно столько строительных блоков, чтобы создать большое количество доступного химического пространства для поиска в модели», — говорит Меркадо.
Они проверили модель, оценив, насколько хорошо она может реконструировать синтезируемые молекулы. Ему удалось воспроизвести 51 процент этих молекул, и на воссоздание каждой из них ушло меньше секунды.
Их метод быстрее, чем некоторые другие методы, потому что модель не просматривает все варианты для каждого шага в дереве. Гао объясняет, что у него есть определенный набор химических веществ и реакций, с которыми нужно работать.
Когда они использовали свою модель, чтобы предложить молекулы с определенными свойствами, их метод предложил молекулярные структуры более высокого качества, которые имели более сильное сродство к связыванию, чем те, которые использовались в других методах. Это означает, что молекулы смогут лучше прикрепляться к белку и блокировать определенную активность, например, останавливать репликацию вируса.
Например, при предложении молекулы, которая могла бы стыковаться с SARS-Cov-2, их модель предполагала несколько молекулярных структур, которые могут лучше связываться с вирусными белками, чем существующие ингибиторы. Однако, как признают авторы, это всего лишь расчетные прогнозы.
«Существует так много болезней, с которыми нужно бороться, — говорит Гао. «Я надеюсь, что наш метод может ускорить этот процесс, чтобы нам не приходилось каждый раз проверять миллиарды молекул на предмет заболевания. Вместо этого мы можем просто указать нужные нам свойства, и это ускорит процесс поиска кандидата в лекарство».
Их модель также может улучшить существующие процессы разработки лекарств. По словам Меркадо, если компания идентифицировала конкретную молекулу с желаемыми свойствами, но не может быть произведена, она может использовать эту модель, чтобы предложить синтезируемые молекулы, очень похожие на нее.
Теперь, когда они проверили свой подход, команда планирует продолжить совершенствование шаблонов химических реакций, чтобы еще больше повысить производительность модели. С дополнительными шаблонами они могут запускать больше тестов для определенных заболеваний и, в конечном итоге, применять модель к процессу поиска лекарств.
«В идеале нам нужны алгоритмы, которые автоматически проектируют молекулы и в то же время быстро дают нам дерево синтеза», — говорит Марвин Сеглер, руководитель группы, работающей над машинным обучением для разработки лекарств в Microsoft Research Cambridge (Великобритания). связанных с этой работой. «Этот элегантный подход профессора Коли и его команды является важным шагом вперед в решении этой проблемы. Несмотря на то, что существуют более ранние работы по проверке концепции дизайна молекул с помощью генерации дерева синтеза, эта команда действительно добилась успеха. Впервые они продемонстрировали превосходную производительность в значимом масштабе, так что это может иметь практическое значение для компьютерных молекулярных открытий.
Эта работа также очень интересна, потому что она может в конечном итоге создать новую парадигму автоматизированного планирования синтеза. Вероятно, это станет огромным источником вдохновения для будущих исследований в этой области».
Это исследование было частично поддержано Управлением военно-морских исследований США и Консорциумом машинного обучения для фармацевтических открытий и синтезов.
[ad_2]
Source