本数据集中包含的图片元素及数量
我们把每一类train vaild test设置为6:2:2
四个主要工作:
(1)load dataset 数据集加载工作
(2)build model
(3)train vaild test
(4)transfer learning
(1)自定义数据集的加载工作
1.继承通用的母类
自己要实现两个功能,一个是_len_,代表样本的总体数量,返回的时候,返回一个整型的数字。
第二个是_getitem_,返回一个指定的x接口的样本。
举一个最简单的例子
# 最简单的读取数据的例子
class NumbersDataset(Dataset): # 按上文所述继母类dataset
def __init__(self,training=True): # training=true即指明这是一个用来训练的数据集,下边就可以判断
if training:
self.samples = list(range(1,1001))
else:
self.samples = list(range(1001,1501))
def _len_(self):
return len(self.samples)
def _gemtitem_(self,idx):
return self.samples[idx] # idx代表数据的位置