一 背景
UCSF DOCK6是用于药物发现的分子对接程序。它是由Irwin D. Kuntz,Jr.和UCSF的同事开发的(见UCSF DOCK)。该程序给定蛋白质结合位点和小分子,试图预测结合位点中的小分子的正确结合模式,以及相关的结合能。具有高良好结合能量的小分子可能是新的药物先导化合物。这使DOCK6成为有价值的药物发现工具。DOCK6通常用于筛选数百万化合物的大规模文库,针对给定的蛋白质筛选出潜在的先导化合物。然后进一步研究这些先导化合物,最终可能产出新的药物。
二 算法
UCSF DOCK6 的对接算法有两种,一种是rigid刚性对接,一种是anchor&grow对接。
DOCK6 的anchor&grow算法分为三个步骤:首先用几何方法将配体刚性部分(anchor)对接。分层添加的非刚性段;能量最小化。得到的配置被“修剪”,能量被重新最小化,从而产生对接配置。
安装与配置系统变量
系统:LINUX (我用的是虚拟机,你可以下载VMware workstation软件,然后创建一个Ubuntu虚拟机,具体教程自行查询)
在虚拟机中解压下载的DOCK6压缩包,并按教程安装:在Ubuntu下装dock6(用于分子对接的程序)_zzyzgg的博客-CSDN博客_dock6因为我新装的ubuntu是比较裸的系统,并没有c++编译环境,所以需要先装g++,gfortran,没有make的话也要装一下。语句如下:sudo apt-get install build-essentialsudo apt-get install gfortran如果apt-get版本比较落后的话要用apt-get update更新一下。另外还要安装下面这两个东西,虽然不知道...https://blog.csdn.net/zzyzgg/article/details/81149212?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%AE%89%E8%A3%85DOCK6.8&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-2-81149212.142%5Ev5%5Epc_search_result_control_group,143%5Ev6%5Eregister&spm=1018.2226.3001.4187安装好以后,打开终端运行以下指令将 dock6 变为系统变量:
gedit ~/.bashrc #打开.bashrc
然后在打开的文件最下方输入以下命令:(我直接将dock6解压到用户文件夹了,所以直接~/dock6就是路径了,如果你解压到别的路径中,则要修改)
export PATH=$PATH:~/dock6/bin
然后在终端输入以下命令:(网上有将dock6设为永久系统变量的方法,我这种方法每次开机可能还需要重新设置。自行查询)
source ~/.bashrc #source立即生效
相关软件:UCSF Chimera 一款可视化处理软件
UCSF Chimera - 操作入门【1】_哔哩哔哩_bilibili
分子对接实例
首先,在虚拟机中创建文件夹以方便后续操作:
files
1.dockprep
2.surface_spheres
3.gridbox
4.dock
注意:以下各个环节的文本文件 “xxx.in” 大多数可以在DOCK6自带的资源中搜索到,直接复制粘贴,然后再打开修改具体文件路径就好。或者你也可以copy我在文末附上的.in文件,再修改成你自己的路径。
配体和受体的准备
确定受体的某些残基状态:阅读受体的相关文献,了解有关受体和配体的质子化状态、电荷、环境条件等重要信息。通过chimera打开pdb文件,查看结构。确定模型的主要成分(受体、配体、溶剂、表面活性剂、金属离子)——检查是否有缺失的残留物或缺失的环。
通过Chimera 打开受体pdb文件,选择蛋白质的你需要的那个链,删去其他链。选择蛋白质,删去蛋白质自带的配体、水分子以及氢原子,保存为 rec_noH.mol2
在此基础上,对上述受体进行以下操作来进行“加氢”、“加电荷”的准备。
Tools -> Structure Editing -> Add H (加氢)
Tools -> Structure Editing -> Add Charge (使用最新版本的 AMBER force filed 来加电荷,例如AMBER ff14SB)
Save as a mol2 file. (存为rec_withH.mol2)
或者用这个工具来加氢加电荷:
Tools -> Structure/Binding Analysis -> DockPrep
配体分子也通过chimera进行加氢、加电荷,存为ligand.mol2
准备好的受体和配体存在 1.dockprep 文件夹中
生成受体的表面文件,生成结合口袋的球体
通过Chimera打开受体rec_noH.mol2
- Action -> Surface -> Show
- Tools -> Structure Editing -> Write DMS 得到rec_noH.dms文件
- 将rec_noH.dms 保存
在文件夹中复制粘贴INSPH文件(官方安装包里自带的,复制粘贴即可),并修改里面的名称:
rec_noH.dms
R
X
0.0
4.0
1.4
rec.sph
输入命令:sphgen -i INSPH -o OUTSPH 即可生成球体的文件“rec.sph”,“OUTSPH”.
在Chimera中打开 rec.sph ,看到球体就像下面:
选择结合位点的球体(有两种方法)
1.使用sphgen生成的球体簇中数目最多的cluster_1(一般就是口袋处的球体簇)
首先要在当前文件夹中有sphgen_cluster.in文件。该文件内容如下:
rec.sph #输入文件
1 #表明对象是cluster_1
N
selected_cluster.pdb #输出文件
将cluster_1存为pdb的代码如下:
showsphere < sphgen_cluster.in
用Chimera打开selected_cluster.pdb,按以下操作:
action > atoms/bond > sphere #将球体放大
favorite > model panel #控制各个部分的颜色
2.已知口袋的位置的基础上选定范围内的球体(例如从PDB官网下载的蛋白本身就自带配体,而你用Chimera也单独保存了该配体的文件,就可以选定该配体的位置)
例如我下载的PDB文件中就有配体,我将其分离出来、处理好后命名为lig_charged.mol2,那么我想选择对接位点的球体簇时就可以直接通过这个配体确定位置:
sphere_selector rec.sph lig_charged.mol2 10.0 #其中10.0是以配体为中心10.0半径内的意思
输出 selected_sphere.sph文件
生成Box文件(找到box.in文件,复制粘贴到当前路径,并打开修改其中文件的路径)
showbox < box.in #生成box.pdb
生成格点Grid
(找到grid.in文件,复制粘贴到当前路径,并打开修改其中文件的名称、所使用力场的具体路径等等:往下翻文件,遇到有些插件的路径引用的地方,就改成你的虚拟机中该插件的具体路径)
grid -i grid.in #生成grid.bmp grid.nrg grid,cnt
刚性对接 rigid dock
首先将DOCK6自带教程中的rigid.in文件放到当前的工作目录,修改好其中文件的路径。
(如果对vim函数比较熟悉,可以使用$ vi rigid.in创建,但要手动复制粘贴内容)
然后执行命令:
dock6 -i rigid.in
得到rigid_scored.mol2
在Chimera的Viewdock中打开生成的rigid_scored.mol2文件,就能看到打分值等信息。
Tool > surface/binding analysis > viewdock 打开rigid_scored.mol2
同时打开rec_noH.pdb,就可以查看其对接构象。
anchor&grow 对接
配体最大的子结构被识别为刚性放入结合口袋中调整位置,随后剩下的片段视为柔性处理。
首先,在文件夹中要创建一个“anchor_and_grow.in”文件
(如果对vim函数比较熟悉,可以使用$ vi anchor_and_grow.in创建,再copy其中的内容)
然后执行命令:
dock6 -i anchor_and_grow.in
在Chimera的Viewdock中打开生成的anchor_and_grow_scored.mol2文件,就能看到打分值等信息。
Tool > surface/binding analysis > viewdock 打开anchor_and_grow_scored.mol2
同时打开rec_noH.pdb,就可以查看其对接构象。
附录:各个步骤的 .in 文件
INSPH
rec.dms R X 0.0 4.0 1.4 rec.sph
box.in
Y 20 selected_spheres.sph 1 box.pdb
grid.in
compute_grids yes grid_spacing 0.3 output_molecule no contact_score yes energy_score yes energy_cutoff_distance 9 atom_model a attractive_exponent 6 repulsive_exponent 12 distance_dielectric yes dielectric_factor 4 bump_filter yes bump_overlap 0.75 receptor_file rec_charged.mol2 box_file box.pdb vdw_definition_file ../vdw_AMBER_parm99.defn score_grid_prefix grid contact_cutoff_distance 4.5
rigid.in
conformer_search_type rigid use_internal_energy yes internal_energy_rep_exp 12 internal_energy_cutoff 100.0 ligand_atom_file ../4NUS/BI-D1870.mol2 limit_max_ligands no skip_molecule no read_mol_solvation no calculate_rmsd no use_database_filter no orient_ligand yes automated_matching yes receptor_site_file &n