使用ZINC15下载小分子数据集

前言

ZINC数据库用于虚拟筛选的市售化合物的免费数据库。ZINC包含超过1300万种3D格式的可购买化合物。ZINC由位于加利福尼亚大学旧金山分校(UCSF)药物化学系的Shoichet实验室提供。
ZINC数据库是一个小分子结构数据库,在该数据库中存放有大量现在市场销售的小分子化合物这就为药物研发提供了非常方便的药物性质测试,而不用去自行设计合成路线获得小分子化合物之后再进行相关药物活性的测试。特别是针对如今计算技术的发展越来越多的计算机辅助药物设计方案的出现加快的了药物筛选的进程。在通过ZINC数据库大量分子的筛选之后可以直接将筛选出的可能有活性的化合物通过ZINC提供的连接找到供应商购买小分子化合物,从而方便快捷的测定药物体外活性。
ZINC免费数据库收录了ChemBridge、Enamine和PubChem等众多化合物数据,可全部免费下载并可下载单个供应商的数据。
ZINC数据库包含包括片段库、类药性库、药物库、天然产物库等,这些化合物含有供应商、分不量可旋转键数氢键受体及供体等信息、可根据客户需要,下载指定数据库讲行虚拟筛选。
zinc15点击打开zinc15网址如下图(由于是外网,打开可能得随缘,挂个VPN效果会好很多)
在这里插入图片描述

1.zinc网页选择合适分子下载

  1. 点击上图的Tranches,得到如下图
    在这里插入图片描述

  2. 选择自己需要的数据库点击下载
    在这里插入图片描述
    下载的不同格式选择
    在这里插入图片描述
    下载方法,我们一般选择URLs这种方法就可以,其他的方法也可以下载,这里只说明URLs方法怎么下载数据集
    在这里插入图片描述

2.得到所需的数据集文档

1.按照如上步骤可以下载得到该数据集,我们将此数据集放在单独的文件夹中,这里我命名为zinc文件夹
在这里插入图片描述
2.查看文件
我们将此文件用记事本打开如下图可以看到该文档记录的是数据集的链接,并非数据集,所以我们需要通过其他方法对其进行下载
在这里插入图片描述

3.Windows安装Wget

1.Wget下载

在这里插入图片描述
按照自己的电脑系统位数下载个最新版的即可ZIP和EXE都可以
2.配置环境
然后将下载下来的wget.exe执行文件剪切放入C:\Windows\System32路径即可(这样cmd就可以指令输出)
在这里插入图片描述
3.完成上步之后可以打开cmd输入wget -help查看是否安装成功,如果显示了一串指令帮助说明安装成功
在这里插入图片描述

4.通过Wget下载数据集

1.找到刚刚下载的数据集文档zinc,在路径这里输入cmd如下图
在这里插入图片描述
点击回车,得到如下图
在这里插入图片描述
2.输入指令

wget - i ZINC-downloader-2D-txt.uri

ZINC-downloader-2D-txt.uri为你的数据集文档名字复制过来就行
3.数据下载
在这里插入图片描述
在这里插入图片描述
可以看到很多新的文本文档用记事本打开就会看到所下载的数据集数据

在这里插入图片描述

4.总结

1.网页下载文本文档,可以选择所得到的数据集格式
2.通过Wget指令下载数据集

5.python导出txt文件

#将txt数据文件导出
import numpy as np

txt_path = 'D:\zhuomian\zinc\AAAB.txt'	# txt文本路径
f = open(txt_path)
data_lists = f.readlines()	#读出的是str类型

dataset= []
# 对每一行作循环
for data in data_lists:
    data1 = data.strip('\n')	# 去掉开头和结尾的换行符
    data2 = data1.split('\t')	# 把tab作为间隔符
    dataset.append(data2)	# 把这一行的结果作为元素加入列表dataset

dataset = np.array(dataset)
print(dataset)

生成Dataframe格式

import pandas as pd
data=pd.DataFrame(dataset)
data.columns=data.iloc[0,:]
data.drop([0],inplace=True)
data

得到数据集
在这里插入图片描述

  • 7
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值