首先抛出两个问题:
· 什么是csv文件?
· 为什么要用csv文件?
CSV文件:CSV逗号分隔值文件(Comma Separated value),是一种用来存储数据的纯文本文件格式,通常用于电子表格或数据库软件。
CSV文件的好处:
1.文件结构简单,基本上和文本的差别不大;
2.可以和Excle进行转换,这是一个很大的优点,很容易进行察看模式转换,但是如果你同样的csv文件和将其转换成xls文件后的size比较就更加明白它在size上的优势了。
3.由于其简单的存储方式,一方面可以减少存储信息的容量,这样有利于网络传输以及客户端的再处理;同时由于是一堆没有任何说明的数据,具备基本的安全性。
在深度学习的使用中,一定会遇到将自己的图片数据集转化为csv文件,下面直接上干货。
#coding:utf-8
import os
import csv
def create_csv(dirname):
path = './dataset/'+ dirname +'/' #修改为你自己的图片路径即可
name = os.listdir(path)
with open (dirname+'.csv','w') as csvfile:
writer = csv.writer(csvfile)
writer.writerow(['data', 'label'])
for n in name:
if n[-4:] == '.jpg':
print(n)
writer.writerow(['./dataset/'+str(dirname) +'/'+ str(n),'./dataset/' + str(dirname) + 'label/' + str(n[:-4] + '.png')])
else:
pass
if __name__ == "__main__":
create_csv('train')
create_csv('test')