题目:分子表示学习用于新材料研发:结合理论计算与端到端预测
报告人:
欧琪副研究员
中石化石油化工科学研究院有限公司
时间: 2024年4月11日 下午15:00
地点:李兆基科技大楼B518会议室
摘要:
基于transformer架构 的分子表示学习(molecular representation learning,MRL)已被广泛应用于新材料的研发中。作为分子表示学习模型的代表,Uni-Mol通过三维空间位置编码和原子对表征学习分子三维空间结构,相较于以分子一维序列或二维拓扑图为输入的MRL模型有更大的表示能力和应用范围。我们通过两个实际应用场景验证了Uni-Mol作为材料性质预测模型的高度可行性。第一个场景为有机发光二极管(organic light-emitting diode,OLED)分子的发光性质预测及筛选,此场景结合了高精度量子化学计算预测微观性质。针对第二代即第三代OLED发光分子,我们分别根据自动生成的海量分子结构库构建了Uni-Mol预训练模型,并以量子化学计算所得的电子结构及光物理性质为标签对模型进行精修,成功筛选出了此前未报道过的具有良好发光性能的潜力分子。第二个场景为有机液体介电常数的预测,此场景为针对宏观实验性质的端到端预测。我们以PM6开源数据库中的6千万种有机小分子为结构库构建预训练模型,并以几百到1千余条实验数据为标签对模型进行精修,成功得到了适用于多种有机液体的介电常数预测模型,这些精修模型可用于多种功能材料的研发,且预训练模型可根据需要拓展到其他性质预测的场景中,具有广泛的应用潜力。
简介:
欧琪,女,中石化石油化工科学研究院有限公司副研究员。本科毕业于中国科学技术大学,博士毕业于美国宾夕法尼亚大学。从事电子结构及机器学习辅助泛函方向研究,获得中国博士后面上基金及国家自然科学基金资助。在J. Am. Chem. Soc.、Nat. Commun.等杂志发表学术论文20余篇,参与撰写专著1部。
供稿人:张亮
审核人:刘有晟、游小清