Cornell 数据集
由于研究方向需要Cornell数据集进行训练,所以最近把数据集下载下来看看怎么样的,如何输入到pytorch的DataLoader里读取。数据集下载下来以后发现数据文件都混杂在一起,搜了一下大概看了看如何构造自己的dataset,好像需要将图片和txt文件分开来,所以就写个python脚本用来分离两种文件。详细代码如下:
import os
import shutil
root = 'D:\\Cornell_data\\01'
image = 'D:\\Cornell_data\\image'
label = 'D:\\Cornell_data\\label'
for x in os.scandir(root):
if x.name.endswith(".png"):
needpath = 'D:\\Cornell_data\\01\\{name}'.format(name=x.name)
shutil.move(needpath, image)
if x.name.endswith("neg.txt") or x.name.endswith("pos.txt"):
needpath = 'D:\\Cornell_data\\01\\{name}'.format(name=x.name)
shutil.move(needpath, label)