浙江大学药学院研究团队在NatureMachineIntelligence报道基于提示学习的多性质分子优化方法
来源:浙江大学 时间:2024-12-23 09:10:56
在药物设计的关键研究领域,我们面临的挑战远非单一维度所能概括,复杂的设计任务往往需要满足多个约束条件。随着AI驱动的计算方法的深度整合,我们在初筛活性分子的效率和效果上取得了显著的进步,但AI在分子优化中的研究相对较少,进展相对缓慢。
2024年10月21日,浙江大学药学院侯廷军和谢昌谕团队、中南大学曹东升团队在《Nature Machine Intelligence》上发表了题为“Leveraging Language Model for Advanced Multi-Property Molecular Optimization via Prompt Engineering”的研究成果,一种利用提示学习来进行多性质分子优化的方法Prompt-MolOpt。该算法利用提示学习的训练策略,实现了零样本学习和少样本学习在多性质优化中的应用,使模型能够在单性质数据训练的情况下也能有效处理多性质的优化任务。此外,通过将输入数据从传统的canonical SMILES字符串转变为一个更加细致且目标性强的格式(包括待优化性质标签、药效团分隔符、药效团、待优化基团分隔符和待优化基团五个部分),该算法能够在性质优化的同时保留药效团的完整性。实验结果表明,Prompt-MolOpt在多性质优化中优于现有的方法。该方法有望提高分子优化的成功率,并确保优化过程中药效团的完整性,为分子设计和药物开发领域提供一种高效、精准且可靠的优化工具。
图1. Prompt-MolOpt构建流程。
浙江大学药学院为本论文的第一署名单位,浙江大学药学院博士后吴振兴为第一作者,浙江大学侯廷军教授和谢昌谕教授、中南大学曹东升教授为共同通讯作者。
原文链接:https://www.nature.com/articles/s42256-024-00916-5