Создание лучшего аккумулятора с машинным обучением

Создание лучшего аккумулятора с машинным обучением

Разработка лучших молекулярных строительных блоков для компонентов батареи — это все равно что пытаться создать рецепт для нового вида пирога, когда у вас есть миллиарды потенциальных ингредиентов. Задача состоит в том, чтобы определить, какие ингредиенты лучше всего работают вместе или, проще говоря, произвести съедобный (или, в случае батарей, безопасный) продукт. Но даже с современными суперкомпьютерами ученые не могут точно смоделировать химические характеристики каждой молекулы, которая могла бы стать основой материала батареи следующего поколения.

Вместо этого исследователи из Аргоннской национальной лаборатории Министерства энергетики США обратились к возможностям машинного обучения и искусственного интеллекта, чтобы значительно ускорить процесс обнаружения батарей.

Как описано в двух новых статьях, исследователи Аргонна впервые создали высокоточную базу данных, содержащую примерно 133 000 небольших органических молекул, которые могут составлять основу электролитов аккумуляторов. Для этого они использовали вычислительно-интенсивную модель под названием G4MP2. Эта коллекция молекул, однако, представляла собой лишь небольшое подмножество из 166 миллиардов молекул большего размера, которые ученые хотели исследовать в качестве кандидатов на электролит.

Поскольку использование G4MP2 для разрешения каждой из 166 миллиардов молекул потребовало бы невозможного количества вычислительного времени и мощности, исследовательская группа использовала алгоритм машинного обучения, чтобы связать точно известные структуры из меньшего набора данных с гораздо более грубо смоделированными структурами из больший набор данных.

«Когда дело доходит до определения того, как работают эти молекулы, существует большой компромисс между точностью и временем, которое требуется для вычисления результата», — сказал Ян Фостер, директор подразделения Argonne Data Science and Learning и автор одной из статей. «Мы считаем, что машинное обучение представляет собой способ получить молекулярную картину, которая почти столь же точна, за долю вычислительных затрат».

Чтобы обеспечить основу для модели машинного обучения, Фостер и его коллеги использовали менее сложную вычислительную среду моделирования, основанную на теории функционала плотности, структуру квантово-механического моделирования, используемую для расчета электронной структуры в больших системах. Теория функционала плотности обеспечивает хорошее приближение молекулярных свойств, но менее точна, чем G4MP2.

Уточнение алгоритма для более точного получения информации о более широком классе органических молекул включало сравнение атомных положений молекул, рассчитанных с помощью высокоточного G4MP2, и тех, которые были проанализированы с использованием только теории функционала плотности. Используя G4MP2 в качестве золотого стандарта, исследователи могли бы обучить модель теории функционала плотности для включения поправочного коэффициента, повышая его точность при одновременном снижении вычислительных затрат.

«Алгоритм машинного обучения дает нам возможность взглянуть на отношения между атомами в большой молекуле и их соседями, увидеть, как они связываются и взаимодействуют, и искать сходства между этими молекулами и другими, которые мы хорошо знаем», — сказал Аргонн. вычислительный ученый Логан Уорд, автор одного из исследований. «Это поможет нам делать прогнозы относительно энергий этих более крупных молекул или различий между вычислениями с низкой и высокой точностью».

«Весь этот проект предназначен для того, чтобы дать нам максимально возможную картину кандидатов в электролит аккумуляторов», — добавил химик Аргонн Раджив Ассари, автор обоих исследований. «Если мы собираемся использовать молекулу для накопления энергии, нам нужно знать такие свойства, как ее стабильность, и мы можем использовать это машинное обучение для более точного прогнозирования свойств больших молекул».

27 июня в онлайн-выпуске Chemical Science появилась статья, описывающая формирование набора данных на основе G4MP2 «Точные квантово-химические энергии для 133 000 органических молекул».

Вторая статья, описывающая алгоритм машинного обучения, «Предсказание машинного обучения точных энергий атомизации органических молекул на основе квантово-химических расчетов низкой точности», появилась в выпуске MRS Communications от 27 августа.


Источник истории:

Материалы предоставлены DOE / Argonne National Laboratory . Оригинал написан Джаредом Сагоффом. Примечание: содержание может быть отредактировано по стилю и длине.


Ссылки на журналы :

  1. Логан Уорд, Бен Блейзик, Ян Фостер, Раджив С. Ассари, Бадри Нараянан, Ларри Кертисс. Предсказание машинного обучения точных энергий атомизации органических молекул из квантово-химических расчетов с низкой точностью . MRS Communications , 2019; 9 (3): 891 DOI: 10,1557 / mrc.2019.107
  2. Бадри Нараянан, Пол К. Редферн, Раджив С. Ассари, Ларри А. Кертисс. Точные квантово-химические энергии для 133 000 органических молекул . Химическая наука , 2019; 10 (31): 7449 DOI: 10.1039 / C9SC02834J