Tensorflow深度学习入门——自制数据集
python 将自己的图片数据集制作成tensorflow可读取的数据集文件*.cvs
这里假设你已经有了样本图片数据集,而且正样本和负样本已经分好类了
说明下制作正样本数据集*.csv的过程,负样本数据集的制作也同样
import os,os.path
import shutil,string
dir = "F:\Python27\work\deal-file\pos"
outdir = "pos"
label = " 1"
fileList = os.listdir(dir)
#列出dir目录下的目录和文件
fileinfo = open('list.csv','w')
#将结果保存在list.csv中
for i in fileList:
curname = os.path.join(outdir, i)
print curname
fileinfo.write(curname + ' 1' + '\n') #这里 1 为正样本的标签
#print i
fileinfo.close()
生成的样本集如下:
其他相关的函数可参考:
Python的os模块,包含了普遍的操作系统功能,这里主要学习与路径相关的函数:
os.listdir(dirname):列出dirname下的目录和文件
os.getcwd():获得当前工作目录
os.curdir:返回当前目录('.')
os.chdir(dirname):改变工作目录到dirname
os.path.isdir(name):判断name是不是一个目录,name不是目录就返回false
os.path.isfile(name):判断name是不是一个文件,不存在name也返回false
os.path.exists(name):判断是否存在文件或目录name
os.path.getsize(name):获得文件大小,如果name是目录返回0
os.path.abspath(name):获得绝对路径
os.path.normpath(path):规范path字符串形式
os.path.split(name):分割文件名与目录(事实上,如果你完全使用目录,它也会将最后一个目录作为文件名而分离,同时它不会判断文件或目录是否存在)
os.path.splitext():分离文件名与扩展名
os.path.join(path,name):连接目录与文件名或目录
os.path.basename(path):返回文件名
os.path.dirname(path):返回文件路径