如何使用wget下载zenodo里的数据

文章介绍了使用wget命令从Zenodo平台下载特定记录号的数据文件的方法,并提供了如何在CentOS系统中使用mv命令进行文件重命名的步骤。用户需替换记录号和文件名以匹配所需下载的文件,并可指定保存路径。同时,文章也展示了如何移动并重命名文件的命令。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何使用wget下载zenodo里的数据

您可以使用以下命令使用wget下载Zenodo中的数据:

 

bashCopy code

wget https://zenodo.org/record/<record_number>/files/<file_name>

其中,<record_number>是Zenodo记录的编号,而<file_name>是您要下载的文件的名称。

例如,如果您要下载编号为5524218的记录中的文件data.txt,请使用以下命令:

 

bashCopy code

wget https://zenodo.org/record/5524218/files/data.txt

如果您想将文件保存到特定目录中,请使用以下命令:

 

rubyCopy code

wget https://zenodo.org/record/5524218/files/data.txt -P /path/to/directory

其中,/path/to/directory是您想要将文件保存到的目录的路径。

centos 给文件重命名

您可以使用Linux的mv命令在CentOS上重命名文件。

语法如下:

 

sqlCopy code

mv old-file-name new-file-name

例如,如果您要将文件old.txt重命名为new.txt,请使用以下命令:

 

javascriptCopy code

mv old.txt new.txt

这将在当前目录中将文件old.txt重命名为new.txt。如果您想将文件从一个目录移动到另一个目录并重命名,请使用以下命令:

 

vbnetCopy code

mv /path/to/old-directory/old.txt /path/to/new-directory/new.txt

### 下载 QM9 数据集的方法 QM9 数据集是一个广泛用于化合物属性预测研究的数据集合,包含了约 134,000 种小分子的几何、能量、电子和热力学性质[^5]。以下是几种常见的下载方式: #### 方法一:通过 DFT 计算结果文件直接下载 QM9 数据集通常可以通过公开的科学数据存储库访问。例如,可以从以下链接之一下载完整的数据集: - **GitHub**: 多个开源项目托管了经过预处理的 QM9 数据集版本。例如,`torchdrug` 或 `DeepChem` 提供了可以直接加载的接口。 - **Zenodo**: Zenodo 是一个开放存取平台,许多研究人员会在此上传他们的实验数据。搜索关键词 “QM9 dataset” 可找到对应的压缩包。 具体操作如下: ```bash wget https://ndownloader.figshare.com/files/[file_id] tar -xvf qm9.tar.gz ``` 上述命令中的 `[file_id]` 需要替换为实际 Figshare 页面上的文件 ID。 #### 方法二:借助 Python 工具自动加载 如果不想手动下载并解压数据集,可以使用一些流行的机器学习框架来自动化这一过程。比如 DeepChem 和 PyTorch Geometric (PyG),它们都内置了对 QM9 的支持。 ##### 使用 DeepChem 加载 QM9 数据集 安装 DeepChem 后运行以下脚本即可完成加载: ```python import deepchem as dc tasks, datasets, transformers = dc.molnet.load_qm9() train_dataset, valid_dataset, test_dataset = datasets print(f"Tasks: {tasks}") ``` 此代码片段不仅能够下载原始数据,还会对其进行必要的前处理以便后续建模工作[^2]。 ##### 利用 PyTorch Geometric 获取图表示形式下的 QM9 对于基于 GCNs 的任务来说,推荐采用 PyTorch Geometric 来读入数据。执行下面几行指令即刻获得所需资源: ```python from torch_geometric.datasets import QM9 dataset = QM9(root='./data') print(len(dataset)) # 输出总样本数 ``` 这指定目录作为保存位置;首次调用时程序会联网抓取最新版档案,并缓存在本地磁盘上以备下次快速检索[^4]。 --- ### 注意事项 无论采取哪种途径获取资料,请务必确认最终取得的内容确实满足自己项目的特定需求——因为不同来源可能提供略有差异甚至完全不同的字段组合或单位定义(参见 property_unit_dict 描述)。另外也要留意版权归属情况,合理合法地运用这些公共资源开展学术活动或者商业用途。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信小博士

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值