【佳作推荐】上海药物所郑明月小组Nat Comput Sci论文:PBCNet模型用于计算配体分子的相对结合自由能

时间:2023-11-20 15:24:44   热度:37.1℃   作者:网络

分子对接结合打分函数的虚拟筛选流程广泛地用于先导化合物发现,已经成为药物设计中的常见范式。在发现了活性先导化合物之后需要进行结构优化,采用的手段通常是在固定先导化合物结构母核的基础上对部分片段作微小的修饰。然而在这一阶段的药物设计过程中打分函数的结果往往不具有指导意义,比较准确的计算手段是通过自由能微扰方法(FEP)计算两个配体分子之间的相对结合自由能。在合理设置参数和微扰过程的情况下,FEP的计算误差在1.0 kcal/mol左右,接近实验精度,可以很好地指导化合物结构优化的方向和策略。然而建立FEP模拟体系的过程较为繁琐。商业软件薛定谔中的FEP+模块尽管使用简单,但是需要收取较为昂贵的费用。另一方面,FEP需要消耗非常大量的计算资源,难以大规模开展。近期,上海药物所郑明月课题组开发了深度学习模型PBCNet(pairwise binding comparison network)用于快速准确预测配体相对结合自由能。测试结果显示,在利用少量数据进行微调优化的情况下,PBCNet可以与FEP+具有相近的性能,但仅需要FEP+十万分之一的计算时间,为先导化合物结构优化设计提供了方便有效的计算工具,相关工作发表在Nature Computational Science上 (Nat. Comput. Sci. 2023, 3, 860–872)。

PBCNet的整体框架如图1所示。首先通过图卷积神经网络从蛋白结合口袋中提取蛋白结构特征之后通过另一组神经网络将蛋白结构特征与配体特征进行融合(图1a)。此后,利用AttentiveFP网络计算融合了蛋白口袋特征的两个配体的最终特征(图1b)。最后,利用提取的特征预测配体之间的相对结合自由能。同时作者为PBCNet添加另一个辅助分类任务帮助模型学习:预测配体1是否比配体2具有更好的亲合性(图1c)。

图片

图1、PBCNet的整体框架。

训练PBCNet需要的数据集的组成为已知复合物结构和相对亲合性数值的配体。为此,作者以BindingDB v.2020为数据来源构建了PBCNet的训练数据集。作者首先从BindingDB中提取了1265组化合物系列,每一组系列中均有化合物具有已知的晶体复合物结构。在每一组化合物中,利用Glide为没有复合物结构的化合物产生对接构象并基于以下规则进行挑选:(1)对接分子与已知晶体复合物结构的配体分子的公共结构片段之间的RMSD值小于2.0 Å;(2)同时具有多个满足条件的构象选取对接得分最高的构象。最后从BindingDB提取IC50数值。经过以上步骤,作者最终获取了971组化合物系列,平均每个系列有39个化合物结构。通过两两配对,作者最终得到约60万个已知结构和相对亲合性数值的一对配体组成的数据集。另外,为了测试PBCNet的性能,作者还构建了两个测试集(FEP1和FEP2,在构建训练集时两个测试集中与训练集重合的部分已被移除)。

作者首先在FEP1和FEP2上测试了PBCNet的性能,结果显示,PBCNet在FEP1和FEP2上分别能达到RMSE 1.11 kcal/mol和1.49 kcal/mol的水平,相比于其他同类型模型和Glide SP以及MM-GBSA均有显著优势,不过并没有超过FEP+。从Spearman相关系数而言,PBCNet在所有的测试体系上均比较稳定,而打分函数Glide SP在不同体系上的性能相差很大。这说明PBCNet的预测结果具有较好的稳定性。

以上测试对应的场景是在未知任何分子活性的情况下应用PBCNet。在实际的分子结构优化过程中,通常已经通过实验测得几个配体分子的亲合力,因此可以用这几个样本对模型进行调优训练。作者从每一个系列中随机挑选2-10个化合物用于调优训练PBCNet,并测试了在不同样本数下PBCNet的性能。结果显示,使用少量样本进行训练后,PBCNet可以与FEP+具有相近的预测性能(图2)。由于PBCNet具有比FEP+约十万倍的计算效率,因此PBCNet在实际的结构优化药物设计中可以快速高效地进行应用。

图片

图2、PBCNet在FEP1和FEP2测试集上进行小样本学习后的表现,其中蓝色虚线为FEP+的测试结果。PBCNet在进行小样本调优后具有与FEP+相当的性能。

作者还模拟了PBCNet在实际项目中的应用,以评估应用PBCNet带来的效率提升。作者总共设计了九组数据,对比了在PBCNet的预测结果指导下发现最优活性化合物的次序并和实际发现最优化合物的次序。结果显示,应用PBCNet可以加速分子结构优化项目约473%,同时减少约30%的实验材料消耗。以上结果说明了PBCNet在实际分子结构优化中的应用价值。

总结

作者在此项工作中开发了基于孪生图神经网络的PBCNet模型,可以用于预测具有共同母核结构的一组化合物的活性高低,帮助新药研发人员决定同系化合物的合成优先级。作者展示了PBCNet模型具有较好的准确性和极高的计算效率,可以有效地指导对分子结构进行优化。为了方便使用,作者在其维护的网络服务器上提供了便捷的图形化界面(https://pbcnet.alphama.com.cn/index)。

参考文献

Jie Yu, Zhaojun Li, Geng Chen, Xiangtai Kong, Jie Hu, Dingyan Wang, Duanhua Cao, Yanbei Li, Ruifeng Huo, Gang Wang, Xiaohong Liu, Hualiang Jiang, Xutong Li, Xiaomin Luo & Mingyue Zheng, Computing the relative binding affinity of ligands based on a pairwise binding comparison network. Nat. Comput. Sci. 2023, 3, 860–872

上一篇: 一例局晚期食管鳞癌患者的新辅助免疫治疗与...

下一篇: Eur J Haematol:鲁索替尼治...


 本站广告