4.3. 分子对接概述#

分子对接(molecular docking)是分子模拟的重要方法之一

4.3.1. 定义#

定义1:分子对接是通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间 (如配体和受体) 相互作用,并预测其结合模式和亲合力的一种理论模拟方法。

定义2:分子对接即在计算机中模拟分子识别的过程,其目的是为了找出蛋白及其配体的最佳结合构象,并确保复合物整体的结合自由能最低。

4.3.2. 原理#

  • 分子对接是指根据受体和配体之间通过 能量匹配空间匹配化学性质 匹配来预测相互结合模式及结合力强弱的一种计算技术。

  • 空间匹配 是分子间发生相互作用的基础,能量匹配 是分子间保持稳定结合的基础。通过空间匹配和能量匹配,目前分子对接方法在小分子药物设计、多肽类药物设计、抗体类药物设计以及核酸抑制剂等领域有着广泛的应用

  • 分子对接本质是两个或者多个分子之间的识别过程,早期的分子对接方法使用分子力学方法或者量子化学方法计算小分子之间分子识别,然而由于算法和计算机处理能力的限制,较难处理含有大分子的分子对接过程。随着计算机算力的大幅提升,几何匹配计算通常采用格点计算,片段生长等方法,能量计算则使用模拟退火、遗传算法等方法,广义上定义为刚性对接,半柔性对接与柔性对接这三种对接方法。

  • 分子间相互作用中涉及许多力,主要包括:疏水作用(Hydrophobic)、范德华力(Van der Waals)、芳香氨基酸之间的堆积作用、氢键(Hydrogen bonding)和静电力(Electrostatic forces)。将配体对接到受体结合位点的过程试图模拟配体和其受体之间的相互作用的 最小能量

4.3.3. 分类#

(1). 刚性对接: 靶点分子和配体分子在对接过程中构象不变,只有分子的空间位置和姿态发生变化。该方法计算简略,计算速度快,适合于结构比较大的大分子之间的对接计算,计算结果不够精确。

(2). 半柔性对接: 半柔性对接是药物筛选过程中常用的一种方法,在对接过程中,靶点分子构象不变,配体分子构象在一定范围内发生变化。该方法适合于大分子和小分子化合物之间的对接计算。其计算量较小,速度较快。

(3). 柔性对接: 靶点分子和配体分子在对接时构象均可发生变化。该对接方法计算量大,计算精确,速度慢,适合于精确研究分子间的识别情况。有报道称将配体和受体视为柔性结构得到的对接结果更为准确。

4.3.4. 技术实现#

整个分子对接计算的过程主要包含构象搜索算法(Searching function)和打分函数(Scoring function)两部分:

https://2301032.xyz/dock-1.png

图. 4.3.1 分子对接技术流程#

  1. 构象搜索(Searching function): 构象搜索(Searching function)算法创建最佳数量的配置,其中包括实验确定的结合模式。尽管严格的搜索算法会遍历两个分子之间所有可能的结合模式,但由于搜索空间的大小和完成可能需要的时间,这种搜索是不切实际的。因此,只能对总构象空间的一小部分进行采样,因此必须在计算费用和检查的搜索空间量之间达到平衡。一些常见的搜索算法包括分子动力学、蒙特卡罗方法、遗传算法、基于片段、点互补和距离几何方法、禁忌和系统搜索。

  2. 打分函数(Scoring function): 打分函数(Scoring function)由许多数学方法组成,用于预测称为结合亲和力的非共价相互作用的强度。所有的计算方法的目标都是开发一种可以快速、准确地描述蛋白质和配体之间的相互作用的能量打分函数。目前主流的打分方程算法包括基于力场、半经验、基于知识、机器学习和一致性评价等

    • 基于力场的打分函数 以分子力学计算为中心,包含范德华相互作用(Lennard-Jones 势)、静电相互作用(库仑势)和去溶剂化能等。这些力学参数可以从实验数据或从头算量子力学计算中得出。但由于计算成本的原因,在基于力场的打分函数中,溶剂化和熵项通常被过度简化或忽略。 GoldScore、DOCK 和 AutoDock 的早期版本等程序都使用这种类型的评分功能。

    • 基于知识的打分函数 由源自实验确定的蛋白质配体结构的统计势组成。许多蛋白质-配体复合物的特定相互作用的频率用于通过逆玻尔兹曼分布产生这些电势。这种方法使用大量的蛋白质-配体原子成对项来近似复杂且难以表征的物理相互作用。因此,打分函数缺乏直接的物理解释。DrugScore、ITScore 和 PMF 是基于知识的评分函数的示例。

    • 基于半经验的打分函数 通过一组加权打分项来表征“蛋白质-配体”复合物的结合亲和力。这些打分项可能包括 VDW、静电、氢键、疏水、去溶剂化、熵等。他们的相应权重是通过线性回归拟合“蛋白质-配体”复合物的实验结合亲和力数据来确定的。基于经验的打分函数使用与基于力场的打分函数类似的组成项,每一项的贡献(权重)是从训练数据中学习的,类似于基于知识的评分函数。与基于知识的打分函数相比,由于物理项的限制,经验打分函数不太容易出现过度拟合。 例如 ChemScore、GlideScore、X-Score 和 Autodock Vina 等都是基于半经验的打分函数。

    • 基于机器学习的打分函数 是一组使用机器学习算法,通过关联训练数据中的模式来学习结合亲和力的函数形式的方法。在不采用预定函数形式的情况下,机器学习评分函数可以隐式捕获难以显式建模的分子间相互作用。近年来,ML 评分函数在结合亲和力预测方面显示出显着改进。


蛋白质-小分子配体的技术流程:

  1. 首先准备配体结构文件,对其进行预处理(结构转换、结构优化);

  2. 准备蛋白的晶体结构文件,对其进行预处理(结构修复和调整);

  3. 如果没有蛋白晶体结构,我们需要完整的氨基酸序列进行结构建模(同源建模);

  4. 准备好蛋白之后需要进行活性位点预测,找出大致的对接口袋位置;

  5. 以预测的口袋位置中心为坐标原点建立对接盒子,形状大小视项目而定;

  6. 对接盒子大小等参数根据对接的配体信息(例如配体大小)进行设定;

  7. 以上步骤确定好后,需要设定最后的对接参数以及选择对接精度;

  8. 检查结构文件和参数文件,视项目情况调用服务器资源启,动对接程序。

4.3.5. 对接软件#

在期刊数据库中搜索, 会发现对接软件的文章非常之多,是一个热门领域:

  • 免费(来源)软件:Dock、AutoDock、AutoDock Vina、Ledock、ZDOCK、SwissDock、Smina、UCSF DOCK

  • 商业软件:Glide、GOLD、MOE Dock、Surflex-Dock、LigandFit、FlexX 等,Discovery Studio中的对接模块(LibDock),商业软件的对接界面都进行了更加友好的设计,因此操作起来更加便捷.

  • 基于深度学习的分子对接模型

    • Gnina:基于卷积神经网络(CNN)对配体进行评分和优化,适合高精度对接。

    • DeepDocking:利用深度学习模型预测对接分数,适合大规模分子对接。

4.3.6. 应用#

预测蛋白质与配体之间的结合模式和亲和力,用于药物设计和发现、酶发现与催化。通常采用的方法是,将小分子作为“配体”,将蛋白质作为“受体”。

  • X 射线晶体学;

  • 药物设计与发现

    • 基于结构的药物设计;

    • 先导化合物优化;

    • 虚拟筛选(高通量筛选);

    • 小分子-靶点结合评估

  • 化学机理研究

    • 酶机理研究

  • 分子相互作用研究

    • 药物相互作用(DDI):分析药物之间的竞争结合,预测潜在的药物相互作用。

    • 蛋白相互作用(PPI):研究蛋白之间的相互作用,调控蛋白功能。

    • 蛋白-核酸相互作用:研究生物分子的功能和机制。

4.3.7. 结果分析#

4.3.7.1. PLIP#

4.3.7.2. ProteinsPlus#

  • 一个基于网络的蛋白质结构分析平台.

  • 还提供了一系列分子建模工具,专注于蛋白质-配体相互作用的研究

  • 功能包括氢原子预测、配体识别、相互作用网络分析、状态选择等,这些功能通过不同的服务模块实现,如Protoss软件用于氢原子预测,PoseView软件用于交互式2D可视化.

  • webserve: Universität Hamburg - Proteins Plus Server, 登录即可使用

4.3.7.3. LigPlot+#

4.3.7.4. pymol#

4.3.7.5. VMD#

  • VMD是用于生物分子可视化和分析的软件,支持加载蛋白质和小分子的结构,并生成交互式的2D相互作用图片。

4.3.7.6. Schrodinger#

  • Schrodinger(薛定谔)是一款功能强大的计算化学软件,广泛应用于生命科学、材料科学和药物研发等领域。

  • #商业软件

  • 提供了多种工具来分析非共价相互作用力.

4.3.7.7. Discovery Studio#

  • Discovery Studio 的Visualizer工具可以用于加载和分析蛋白质和小分子的结构,并生成各种类型的2D相互作用图片。

4.3.8. 什么是 Superposition#

分子叠加‌(Superposition):是一种将多个分子的结构进行对齐的操作,以便比较它们的相似性和差异性。它不涉及计算分子之间的相互作用或结合能,而是用于分析分子的空间构型和结构特征。分子叠加常用于结构生物学研究中,比如比较不同蛋白质的结构差异,或者在同一分子在不同条件下的构象变化。这种技术有助于理解分子的结构和功能关系,但并不直接涉及新药的设计或材料的开发‌

4.3.9. 分子对接与分子动力学模拟的联系#

  1. 分子对接有三种方式,刚性对接(配体受体全刚性)半柔性对接(配体柔性,受体刚性)全柔性对接(配体柔性,受体活性部位氨基酸残基柔性)即便是全柔性对接,蛋白质也只是活性口袋的几个氨基酸残基在动,整个蛋白除了几个氨基酸残基以外是固定的。根据酶-受体的诱导契合模型,蛋白也会作出相应的构象改变去适应配体,蛋白整体都会有轻微/剧烈的运动,不太可能只有几个氨基酸残基在动而其他部分完全不动。分子对接完全没法体现蛋白整体的运动;此外,分子对接未考虑时间因素,只看是否结合,有可能结合上去马上就掉下来了。所以说做分子动力学是有必要的

  2. 一般做法是对接选出几种结合模式再做分子动力学。原因如下(1)分子动力学模拟是比较耗计算资源的,做一次模拟的成本比分子对接高的多,如果没有分子对接做参考直接做分子动力学感觉比较浪费计算资源(2)分子动力学结果重现性较差,可能几次跑出来结果不一样,如果初始结构没有依据的话(没做过分子对接或者是其他预测)要想得到好的结果会比较困难

  3. 可靠性:分子对接只是从打分函数+构型构象空间采样的层面给你找出较好的结合方式,但这对于判断是否能稳定结合方面可靠度比较有限。而在合适的力场、恰当的设定下做动力学模拟,相当于通过用计算机来做实验检验在实际环境中配体是否能稳定结合,这有说服力得多。原理上,如果打分函数能直接准确预测结合自由能那是再好不过,但现实中用的各种打分函数考虑的因素都相当有限,更多实际意义在于判断较好结合位置、对结合方式进行排序,而与结合自由能的相关性并不多强。而通过分子动力学,则可以利用MM/GBSA、MM/PBSA、TI/FEP等方式计算绝对的结合自由能,比起对接过程的打分更有现实意义和物理意义。

  4. 作为分子动力学模拟的起始结构:原理上,直接跑无穷长时间的蛋白+配体,最后做轨迹分析判断配体在哪里结合最理想,这是可以的,但在模拟时间尺度有限的现实情况中一般行不通。比如把配体随意放在蛋白质旁边,很可能配体在跑进最理想结合位点之前经常停留在其它地方,浪费巨量模拟时间,甚至在一个亚稳的结合位点一直不出来,导致不仅最稳定结合位置展现不出来,还可能导致严重的误判。

4.3.10. 拓展阅读#