前言
使用Windows环境,在进行分子对接或者人工智能分子筛选时需要从ZINC数据库中下载小分子数据集可参考以下步骤。
一、选择合适的分子范围
- 进入ZINC15网站 点击这里
- 点击Tranches
- 可按条件根据个人需求选择合适的分子范围
二、数据集下载
-
选好合适分子范围后点击下载
-
下载界面我们可以选择时间、下载文件类型和下载方法,这里由于我只需要获取smiles分子式因此选择smi文件,下载方法选WGET
-
下载完成后你会获得一个.wget文件,其中包含了多个wget指令对应下载多个分块子集中的分子(可用记事本打开查看)
三、Windows安装Wget
- Windows环境需要手动安装Wget指令,点击这里下载Wget,下载ZIP或EXE都可以(ZIP解压后包含EXE文件),然后将下载下来的wget.exe执行文件放入C:\Windows\System32
- 完成上步之后可以管理员打开cmd输入wget -help查看是否安装成功,如果显示了一串指令帮助说明安装成功
四、准备就绪,傻瓜式下载分子集!
- 将前面下载的.wget文件后缀改成.bat
- 将修改后的.bat文件放入你想要下载数据集的目录下(比如这里我建立了一个datasets文件夹用来存放数据),然后直接双击运行.bat文件!(注意 !不要!以管理员身份运行)
- 然后系统会自动执行里面的wget指令进行下载,耐心等待下载完成即可!
总结
本文写于2022.6.17,ZINC网站使用方法和分子范围可能会随时间进行更新变化,请以网站说明为准