3.3. 糖苷聚糖和蛋白质结晶#

案例来自论文: “糖基化试剂对硫酸铵结晶蛋白质的影响”

Crystal Growth & Design: Influence of Glycan Agents on Protein Crystallization with Ammonium Sulfate

该论文围绕蛋白质与聚糖的相互作用机制展开,通过分子动力学(MD)模拟及相关分析方法,揭示了聚糖添加剂对蛋白质结晶的影响

  • 使用工具: #Amber

3.3.1. 模型构建#

(1). 使用了两种糖苷聚糖 (glycan) 作为结晶添加剂:

  • 海藻糖(Trehalose)

  • Facade ®-TEG: 3α,7α,12α- 三 [(O-β-D - 吡喃葡萄糖基)乙氧基]- 胆烷

https://2301032.xyz/glycan-proteincryst-2.png

图. 3.3.1 两种聚糖分子的化学结构式#

(2). 选择了两种蛋白质, 硫酸铵(AS)作为沉淀剂进行结晶, 蛋白质结构来自 X-射线晶体解析, PDB数据库.

  • 流感病毒聚合酶酸性亚基 N 端结构域(PAN​): PDB ID 为 7XGC

  • 壳聚糖酶: PDB ID 为 7XGQ

(3). 模拟盒子构建

  • 在PAN​模型中加入 1 个海藻糖分子

  • 在壳聚糖酶模型中加入 1 个 Facade ®-TEG 分子

  • 为保证采样充分,每种蛋白质构建 8 个独立模型,每个模型中 glycan 分子在蛋白质周围溶剂区随机分布于 8 个不同位置。

  • 最后构建不含 glycan 分子的空白对照模型(PAN​和壳聚糖酶各 1 个),用于对比分析。

(4). 溶剂与边界条件: 将蛋白质-glycan 复合物置于长方体周期性边界盒中, 使用 TIP3P 水分子填充盒子, 确保蛋白质到盒边界的最小距离为 20Å;加入抗衡离子(如 Na⁺、Cl⁻)中和系统电荷。

3.3.2. 力场与模拟参数#

  • 力场选择:蛋白质采用 ff14SB 力场,海藻糖和 Facade ®-TEG 采用 GAFF2(General Amber Force Field 2)力场。

  • 电荷计算:通过 Gaussian16 程序计算 glycan 分子的原子电荷 —— 先在 B3LYP/6-31G** 水平下进行几何优化,再用 IEFPCM 方法(溶剂为乙醚,介电常数 ε=4)计算静电势,最后通过 RESP 方法确定原子电荷。

  • 非共价相互作用:非共价相互作用(范德华力、静电力)的截断距离设为 12Å。

3.3.3. 执行 MD#

在有无聚糖存在情况下, 进行了的多次分子动力学(MD)模拟。

按照分子模拟的标准流程,依次进行能量最小化、加热、平衡化和生产模拟:

  1. 能量最小化

    • 第一步:仅优化水分子和抗衡离子,消除局部不合理相互作用;

    • 第二步:优化系统中所有原子,确保整体结构稳定。

  2. NVT平衡:在 NVT 系综(恒容、恒温)下,将系统从低温加热至 300K,时长 100ps,使系统温度达到模拟目标温度。

  3. NPT平衡:在 NPT 系综(恒压、恒温)下进行 400ps 平衡,调整系统体积和压力至稳定状态(压力维持在 1atm)。

  4. 生产模拟:在 NPT 系综下, 每个盒子进行 1μs 生产模拟,时间步长 2fs,记录轨迹用于后续分析。

3.3.4. 结果分析#

通过多种分析方法解析蛋白质与 glycan 的相互作用及系统动态特性:

(1). 结构稳定性评估

  • 均方根偏差(RMSD):计算主链原子(N、Cα、C)的 RMSD,结果显示含 glycan 的模型 RMSD 波动更小(如PAN​的 RMSD 多在 1-2Å),表明 glycan 增强了蛋白质结构稳定性。

  • 回转半径(Rg​):评估蛋白质构象紧凑性,含 glycan 的复合物Rg​值更稳定(如PAN​的平均Rg​为 16.36±0.09Å),提示构象更紧凑。

(2). 原子动态波动分析(B-factor):计算蛋白质主链原子的 B 因子(温度因子, 反映原子热振动),发现 glycan 结合区域的 B 因子低于无 glycan 模型,表明 glycan 降低了结合位点的局部柔性,增强构象刚性。

B 因子(B-factor)又称温度因子,用于量化原子在晶体结构中的位置不确定性,主要来源于原子的热振动和静态无序。一般来说,B 因子值越高,表明该区域原子的波动越大、柔性越强;B 因子值越低,则意味着该区域构象更刚性、稳定性更高。在分子动力学模拟中,B 因子可通过轨迹计算获得,用于反映模拟过程中原子的动态波动特性。

https://2301032.xyz/glycan-proteincryst-3.png

图. 3.3.2 两种蛋白质的 B 因子(橙色线条为不含聚糖) 及蛋白质上标记出的波动幅度#

(3). 构象动态分析(主成分分析,Principal Component Analysis, PCA):对模拟轨迹进行 PCA,结果显示含 glycan 的复合物构象分布更集中(聚类更紧凑),提示 glycan 限制了蛋白质的大范围运动,促进构象稳定。

PCA 通过对原子坐标的协方差矩阵进行特征分解,将蛋白质的复杂运动分解为少数几个主成分(PC),每个主成分代表一种独立的集体运动模式。其中,前两个主成分(PC1 和 PC2)通常贡献最大,可通过二维投影图展示蛋白质构象的分布范围和动态变化趋势。

https://2301032.xyz/glycan-proteincryst-6.png

图. 3.3.3 两种蛋白质主成分分析(PCA)的二维投影#

(4). 结合自由能计算(MM-PBSA 方法):通过公式 \(ΔG_{bind}​=ΔE_{vdW}​+ΔE_{Ele}​−TΔS+(ΔG_{pb}​+ΔG_{SA}​)\) 计算结合能,通过能量分解发现疏水相互作用(范德华力ΔEvdW​)是复合物稳定的主要驱动力(如壳聚糖酶 - Facade ®-TEG 复合物的ΔEvdW​贡献显著)。

(5). 静电势与结合位点分析

  • 静电势计算:用 Delphi 程序计算蛋白质表面静电势,发现多数 glycan 结合位点位于正负电势边界区域(电势绝对值低),与晶体中蛋白质-蛋白质接触区重合。

  • 结合位点预测:通过 Hydrophobe 程序预测疏水位点,验证了 glycan 结合位点的合理性(如PAN​的结合位点位于 α 螺旋与 β 折叠的间隙)。

https://2301032.xyz/glycan-proteincryst-4.png

图. 3.3.4 两种蛋白质的表面静电势等值面及其与相应聚糖分子的位置关系#

综上,文中的分子模拟通过系统的模型构建、严格的参数控制和多维度的结果分析,揭示了 glycan 分子通过稳定蛋白质构象、增强刚性及特异性结合,促进蛋白质结晶的分子机制。