总结一个简单的自定义数据集示例
假设数据文件存储在path中的txt文件中,内容为【时间,数据1,数据2,数据3】的列表
对应的标签存在label.txt中
from torch.utils.data import Dataset
# 自定义数据集,继承自Dataset类
# 必须包含__init__,__getitem__,__len__三个功能
class mydataset(Dataset):
#初始化,调用自定义函数从文件中读入数据
def __init__(self,path,labelfile):
self.samples = self.get_samples(path)
self.labels = self.read_data(labelfile)
#从定义完的数据集中取样本,返回索引值对应的特征和标签
def __getitem__(self, index):
return self.samples[index], self.labels[index]
#数据集总样本数
def __len__(self):
return len(self.labels)
def get_samples(self,path):
filelist = os.listdir(path)
sample_list = []
for file in filelist:
with open(path + file, 'r')as f:
data = f.readlines()
sample_one = []