2.3. AMBER概述#

什么是amber?

AMBER,既是一组用于模拟生物分子的分子力学力场;也是一套生物分子模拟程序。

2.3.1. Amber programs#

  • Amber全称Assisted Model Building with Energy Refinemegnt (辅助的模型构建和能量精化), 是由University of California, San Francisco的Kollman教授课题组开发的一套分子力学和分子动力学模拟软件,包括大约60个程序,如 sander. xleap, antechamber、ptraj、mm_pbsa和nmode等。

  • Amber 是一个完全基于命令行界面(CLI, Command Line Interface)的软件, 且只能在Linux系统上运行.

  • 官网:AmberTools25

  • Amber软件套件分为两个部分: AmberTools和Amber.

    • AmberTools, 一组主要根据GPL许可证免费提供的程序

    • Amber 在 AmberTools 基础上(包含了AmberTools的内容)添加了pmemd 程序,该程序类似于AmberTools 中的sander(分子动力学)代码,但在多个 CPU 上提供了(更)更好的性能,并在 GPU 上显著提高了速度。

  • 现在Amber24可以免费用于非商业用途, 官网提供“pmemd24.tar.bz2”的下载Download Amber MD, 这个pmemd24.tar.bz2 文件是独立可以独立运行的,无需编译和运行 AmberTools

  • AmberTools 提供了一些工具和实用程序,用于辅助分子模拟的前后处理。如构象生成、参数化、模型构建、能量计算、轨迹分析等.

  • Amber 是一个完整的分子动力学模拟软件套件,提供了模拟引擎、力场参数化工具和分析工具等功能。

  • Amber可以用于生物大分子体系的分子力学计算和分子动力学模拟,也可以采用MM_PBSA和MM_GBSA方法研究受体和配体之间的结合自由能,还可进行量子力学和分子力学结合(QM/MM)计算。

对比其它模拟软件:

  • Amber尤擅长于生物体系的分子动力学模拟,功能全面。对于材料体系,则可以考虑使用Lammps。

  • Amber的优点是计算精度高,自定义新分子和新模型比较方便。缺点是计算效率低,速度慢(相比于GROMACS)

  • 与CHARMM不同,Amber不是一个all-in-one的分子动力学软件,也不是某一个程序的名字,而是由多个各司其职的程序所构成的工具集,除了高性能动力学引擎外的其他组分统称AmberTools

2.3.1.1. 准备程序#

  • antechamber和MCPB.py:为一般有机分子和金属中心创建力场的程序

  • tleap和parmed:Amber 模拟的基本准备工具

  • sqm和Quick:半经验、DFTB 和从头算量子化学代码,用于独立计算或 QM/MM

  • pbsa:对泊松-玻尔兹曼模型进行数值解

  • 3D-RISM:解决积分方程模型以进行溶解

2.3.1.2. 模拟程序#

  • sander: 是Amber中进行分子动力学模拟计算的主力程序

  • pmemd 是一个高性能的MD程序, 包含了sander的一部分功能, 它还可以使用图形处理单元(GPU, graphics processing units)加速运行.

  • gem.pmemd:使用高级力场的工具

2.3.1.3. 分析程序#

  • mdgx:一款主要通过参数拟合来突破 Amber MD 界限的程序。还包括可定制的虚拟站点和显式溶剂 MD 功能。

  • cpptraj和pytraj:用于分析轨迹结构和动态的工具

  • mmpbsa.py:基于 MD 轨迹的能量分析

  • FEW:自由能量工作台,提供各种自由能量分析工具

  • fe-toolkit:分析炼金术自由能模拟的例程

2.3.1.4. Amber的工作流程#

https://2301032.xyz/amber-1.png

图. 2.3.1 Amber MD的基本流程#

2.3.2. Amber Force Fields#

  • 最初AMBER力场是专门为了计算蛋白质和核酸体系而开发的,计算其力场参数的数据均来自实验值。後来随著AMBER力场的广泛应用,包括Kollman在内的很多课题组对AMBER力场的内容不断进行丰富,逐渐开发出了一个可以用於生物大分子、有机小分子和高分子模拟计算的力场体系。

  • AMBER力场的优势在于对生物大分子的计算,其对小分子体系的计算结果常常不能令人满意。AMBER力场的势能函数形势较为简单,所需参数不多,计算量也比较小。主要适用于蛋白质和核酸体系、多糖。

  • 对于不同的物质,amber有不同的力场,The Amber Force Fields (ambermd.org)

    • a protein force field (recommended choice is ff14SB)

    • a DNA force field (recommended choice is OL15)

    • an RNA force field (recommended choice is OL3)

    • a carbohydrate force field (recommended choice is GLYCAM_06j)

    • a lipid force field (recommended choice is lipid17)

    • a water model with associated atomic ions (more variable); popular choices are spc/e, tip4pew, and OPC. Not needed if you are using an implicit solvent model.

    • a general force field, for organic molecules like ligands (recommended choice is gaff2)

    • other components (such as modified amino acids or nucleotides, other ions), as needed

2.3.3. Amber的文件#

amber 的文件格式规范,在amber官网的 File Formats 页面可以找到各种文件的描述:Amber File Formats (ambermd.org)

2.3.3.1. 力场参数文件#

  • 在 ambertools 安装目录的/dat/leap目录下存放着力场相关文件,包括:

    • 拓扑参数文件格式(.prmtop,/.top/.parm7)

    • 结构坐标(和速度)文件格式(.inpcrd/.restrt/.rst7)

    • 轨迹文件格式(.mdcrd/.crd/.nc)

    • 力场参数加载命令文件(leaprc.xxx.xx)

    • 力场参数文件(.dat)

    • 力场参数文件(.lib/.off)

    • 力场参数文件(.prepi/.in/.prepin)

    • 力场参数修改文件(frcmod)

  • 为了在 Leap 中添加参数集,需要一个 lib 文件和一个 frcmod 文件,leaprc 文件是调用推荐组合的预制脚本。

  • $AMBERHOME/dat/leap/ 目录下有四个文件夹,主要几类文件分别如下:

    • list of leaprc files available - $AMBERHOME/dat/leap/cmd

    • list of lib/off files available - $AMBERHOME/dat/leap/lib

    • list of frcmod/dat files available - $AMBERHOME/dat/leap/parm

    • list of prepi/in/prepin files available - $AMBERHOME/dat/leap/prep

2.3.3.1.1. leaprc.*#

/cmd 文件夹下的力场参数加载命令文件 leaprc.GLYCAM_06j-1 从上到下内容依次是:

  • 元素及其对应的原子类型

  • 加载原子类型及其杂化信息 .dat 文件

  • 加载主力场参数及残基参数 .prep, .lib

  • 定义匹配PDB文件中的氨基酸名

  • HIS残基的质子化处理(此力场没有)

  • 加载溶剂及离子

addAtomTypes {
        { "C"   "C" "sp2" }
        { "Cg"  "C" "sp3" }
        { "H"   "H" "sp3" }
        { "H1"  "H" "sp3" }
     …………
        { "NT"  "N" "sp3" }
        { "N3"  "N" "sp3" } 
        { "Oh"  "O" "sp3" }
        { "Os"  "O" "sp3" }
        { "S"   "S" "sp3" }
        { "P"   "P" "sp3" } 
}

glycam_06 = loadamberparams GLYCAM_06j.dat

loadamberprep GLYCAM_06j-1.prep

loadOff GLYCAM_amino_06j_12SB.lib
loadOff GLYCAM_aminoct_06j_12SB.lib
loadOff GLYCAM_aminont_06j_12SB.lib

addPdbResMap { 
        { 0 "OLS" "NOLS" } { 1 "OLS" "COLS" }
        { 0 "OLT" "NOLT" } { 1 "OLT" "COLT" }
        { 0 "OLP" "NOLP" } { 1 "OLP" "COLP" }
        { 0 "HYP" "NHYP" } { 1 "HYP" "CHYP" }
        { 0 "NLN" "NNLN" } { 1 "NLN" "CNLN" }
} 

loadOff solvents.lib  # solvents 
HOH = TP3  # set default water model
WAT = TP3 
loadOff atomic_ions.lib  # load ions library
ionsff = loadamberparams frcmod.ionsjc_tip3p  # set ion params for TIP3P

2.3.3.1.2. *.dat#

/pram 文件夹下力场参数文件 GLYCAM_06j.dat 从上到下内容依次是:

  • 描述信息(第一行)

  • 原子的类型(符号 atom symbol),以及质量、化学环境;对应gromacs的.atp文件

  • 亲水原子符号

  • 键长参数

  • 键角参数

  • 二面角参数

  • 不适当的二面角参数

  • 氢键 10-12势参数

  • 非键合 6-12势参数的等价原子符号

  • 非键合 6-12势参数

GLYCAM_06_H PARAMETERS (FOR AMBER 11.0, RESP 0.010), COPYRIGHT CCRC 2011
CT 12.01                 sp3 C aliphatic
2C 12.01                 sp3 aliphatic C with two (duo) heavy atoms copied from ff12SB
H  1.008                 H Bonded to nitrogen atoms
H1 1.008                 H aliph. bond. to C with 1 electrwd. groups
…………

C   H   Ho  Ng  NT  N3  O   Oh  Os  P   O2 

Cg-N   337.0    1.450       Copy of Cg-Ng from GLYCAM06
CT-Os  320.0    1.410       Copy of CT-OS from parm10.dat
2C-Os  320.0    1.410       Copy of CT-OS from parm10.dat
…………
H -N -Cg     30.00    118.00   Copy of H -Ng-Cg from GLYCAM06
Os-Cg-N     106.90    107.90   Copy of Os-Cg-Ng from GLYCAM06
Cg-Cg-N      80.00    109.70   Copy of CT-CT-N  from parm99.dat
…………
Os-Cj-Cj-Cg   1  -13.00        0.0      2    SCEE=1.0 SCNB=1.0 copy of Os-Ck-Ck-Cg
Os-Ck-Ck-Cg   1  -13.00        0.0      2    SCEE=1.0 SCNB=1.0 Lipids, from 1-propenylmethylether
Ck-Cj-Cj-Ha   1  -15.00        0.0      2    SCEE=1.0 SCNB=1.0 copy of Cj-Ck-Ck-Ha
…………

2.3.3.1.3. frcmod.* 或 *frcmod#

也在 /pram 文件夹下,frcmod.文件与 *.dat文件的格式基本相同。可以像标准的 *.dat文件一样读入tleap,将 *.dat文件中的默认参数与 frcmod. 中的新参数合并。 frcmod.ff14SB 从上到下内容依次是:

ff14SB protein backbone and sidechain parameters
MASS
CO 12.01         0.616  !            sp2 C carboxylate group 
2C 12.01         0.878               sp3 aliphatic C with two (duo) heavy atoms
3C 12.01         0.878               sp3 aliphatic C with three (tres) heavy atoms
C8 12.01         0.878               sp3 aliphatic C basic AA side chain

BOND
C -2C  317.0    1.5220
C*-2C  317.0    1.4950
…………

ANGL
N -C -2C    70.0      116.60
O -C -2C    80.0      120.40
…………

DIHE
C8-CX-N -C    1    0.000         0.0            -4.    phi'
C8-CX-N -C    1    0.800         0.0            -3.
…………

IMPR
X -O2-CO-O2        10.5          180.          2.
2C-O -C -OH        10.5          180.          2.

NONB
  2C          1.9080  0.1094             Spellmeyer
  3C          1.9080  0.1094             Spellmeyer

2.3.3.1.4. *.prep 或 *prepin 或 *in#

/prep 文件夹下拓扑数据库文件 GLYCAM_06J-1.prep 记录了各种残基信息:

4ZB  INT 0     ;残基名 内坐标 二进制输出
CORRECT OMIT DU BEG      ;内坐标有着正确的顺序 删除DU原子 从头开始
-1.0000        ;截断值用于环闭合处理
 1 DUMM DU  M  0 -1 -2  0.000   0.000    0.00     0.0000    ;虚拟原子,用来定义残基的空间轴 
 2 DUMM DU  M  1  0 -1  0.500   0.000    0.00     0.0000    ;虚拟原子
 3 DUMM DU  M  2  1  0  1.296  74.264    0.00     0.0000    ;虚拟原子
 ;编号 原子名-原子符号 拓扑连接类型 键-角-二面角 键平衡值-角值-二面角值 电荷
 4 C1   Cg  M  3  2  1 23.413  98.374 -136.24     0.2510
 5 H1   H2  E  4  3  2  1.091  70.111  -94.11     0.0000
 6 O5   Os  M  4  3  2  1.460 133.490  168.28    -0.4130
 …………
21 H2O  Ho  E 20 18 14  0.962 106.072  172.93     0.4220
22 O4   Os  M 12  7  6  1.449 108.907 -172.84    -0.4980

LOOP      ;环闭合处
C2 C1

DONE

注意:prepi和prepc分别是内坐标和卡迪尔坐标系的prep文件, 是以前程序prep使用的 (现已由leap整合),可由antechamber或prepgen产生, 现常用于非标准残基读入和处理

2.3.3.1.5. *.lib#

  • /lib 文件夹下的 .lib 文件记录了氨基酸残基的符号及每个残基的描述

  • 例如 GLYCAM_animo_06j_12SB.lib 文件,为了将聚糖与蛋白质连接起来,必须加载含有修饰氨基酸残基(Ser、Thr、Hyp 和 Asn)的lib。要使用 ff14SB 构建糖蛋白,必须加载 GLYCAM_amino_06j_12SB.lib GLYCAM_aminont_06j_12SB.libGLYCAM_aminoct_06j_12SB.lib,并且还必须加载所需的蛋白质力场。

2.3.3.2. 模拟相关文件#

  • prmtop文件,又名parm7,top,包含分子,原子名称、种类,电荷,键关系,键参数和非键参数信息

  • .prmtop 和 .prmcrd:topology and coordinate files,可以由 LEaP 程序生成。

  • .top 和 .crd

  • .inpcrd:input initial coordinate file,包含了原子的所有坐标,以及模拟盒子的形状。

  • .mdcrd:轨迹文件

2.3.4. Amber的力场#

对于不同的物质,amber提供了不同的力场:
• a protein force field (recommended choice is ff14SB)
• a DNA force field (recommended choice is OL15)
• an RNA force field (recommended choice is OL3)
• a carbohydrate force field (recommended choice is GLYCAM_06j)碳水化合物力场,推荐选择GLYCAM_06j
• a lipid force field (recommended choice is lipid17)
• a water model with associated atomic ions (more variable); popular choices are spc/e, tip4pew, and OPC.
Not needed if you are using an implicit solvent model.
• a general force field, for organic molecules like ligands (recommended choice is gaff2)
• other components (such as modified amino acids or nucleotides, other ions), as needed

2.3.4.1. 蛋白质的力场 ff14SB#

对于蛋白质,amber推荐使用ff14SB力场。SB蛋白质力场家族还有(ff19SB, ff14SB, and ff99SB)。

ff14SB是早期ff99SB力场的继续演变,FF14SB基于FF12SB, FF12SB是FF99SB的更新版本, 而FF99SB力场又是基于原始的Amber的Cornell等人(1995)的ff94力场. FF14SB力场最显著的变化包括更新了蛋白质Phi-Psi的扭转项, 并重新拟合了侧链的扭转项。这些变化一起改进了对这些分子中α螺旋的估计。

ff19SB是SB蛋白力场的最新模型,与更准确的水模型OPC最匹配,建议将ff19SB与OPC水一起使用,而不建议与TIP3P水一起使用。

在 gromacs 官网的User contributions可以找到三个版本的 ff14SB 力场:包括(amber14sb, amber14sb_OL15, amber14sb_parmbsc1)

  • amber14sb.ff:只有蛋白质力场

  • amber14sb_parmbsc1.ff:Parmbsc1 代表 DNA

  • amber14sb_OL15.ff_corrected-Na-cation-params.tar:包含了用于 DNA 的amber OL15 力场和用于 RNA 的 OL3 (chiOL3) 力场,并更正了Na+参数

parmbsc1和OL15是适用于核酸模拟的力场,添加了核酸方面参数的补丁

amber14SB是用于蛋白模拟的Amber力场;而Parmbsc1和OL15是适用于核酸模拟的力场,尤其是DNA,目前Amber官方是建议模拟DNA用OL15,模拟RNA用OL3。

2.3.4.2. 糖类的力场 GLYCAM#

支持多糖的力场有:CHARMM、OPLSAA、GROMOS、GLYCAM

  • 目前,使用比较广泛的多糖力场是GLYCAM

    • GLYCAM力场家族,特别是GLYCAM06,已被广泛应用。GLYCAM06是一个一致且可转移的参数集,用于模拟碳水化合物和糖缀合物。

    • 最新版:2014-03-28,the current GLYCAM parameters are version 06j-1

    • 其他版本:http://legacy.glycam.org/docs/forcefield/all-parameters/

    • 与GLYCAM兼容的蛋白质力场:ff12, ff12SB and later, Compatible GLYCAM leaprc files: leaprc.GLYCAM-06j-1 , leaprc-1.GLYCAM_06i-12SB , leaprc.GLYCAM_06h-12SB

以GLYCAM 06力场为例,在GLYCAM官网在线文档主页的 Force Field子页面的PARAMETERS & ENERGY FUNCTIONS项:Parameters & Energy Functions | Force Field (glycam.org)可以下载到最新的GLYCAM力场参数。

目前最新版本为2014-03-28发布的 GLYCAM_06j-1 和 GLYCAM_06EPb ,这些参数也可以在ambertools安装安装目录的leap目录下找到。

GLYCAM力场文件包括 GLYCAM06 和 GLYCAM06EP 两部分:

  1. GLYCAM06力场

    • leaprc.GLYCAM_06j-1: 使用GLYCAM06的LEaP配置文件, 可单独用于碳水化合物或与ff14SB力场联合使用

    • GLYCAM_06j.dat: 寡糖参数

    • GLYCAM_06j-1.prep: 糖基残基的结构和电荷

    • GLYCAM_lipids_06h.prep: 一些脂类残基的结构和电荷

    • GLYCAM_amino_06j_12SB.lib: 与ff14SB力场兼容的糖蛋白库文件

    • GLYCAM_aminoct_06j_12SB.lib

    • GLYCAM_aminont_06j_12SB.lib

  2. 使用孤对电子(额外点)的GLYCAM06EP力场

    • GLYCAM_06EPb.dat: 寡糖参数

    • GLYCAM_06EPb.prep: 糖残基结构和电荷

    • leaprc.GLYCAM_06EPb: 用于GLYCAM-06EP的LEaP配置文件

注意: glycam力场中的羧基是去质子化的

2.3.4.3. 小分子力场 GAFF#

通用AMBER力场(GAFF, general AMBER force field), GAFF完全兼容AMBER大分子力场,在模拟中可以与其它amber力场混合使用,共同用于处理蛋白和药物分子形成的复合物. 就像传统的AMBER力场一样, GAFF使用简单的简谐势函数来描述键和键角. 但与针对蛋白质和DNA的传统AMBER力场不同的是, GAFF使用的原子类型通用得多, 因此可以涵盖大部分有机分子. GAFF 是一个完整的力场(因此很少出现缺失的参数),它几乎涵盖了由 C、N、O、S、P、H、F、Cl、Br 和 I 组成的所有有机化学空间。此外,由于GAFF与AMBER大分子力场完全兼容,它应该被证明是合理药物设计的有用分子力学工具。特别是在结合自由能计算和分子对接研究中。

2.3.5. 拓展阅读#