零基础自定义数据集入门示例

最新推荐文章于 2024-07-19 13:44:40 发布

Mr_deadline

最新推荐文章于 2024-07-19 13:44:40 发布

阅读量429

点赞数

分类专栏：深度学习 python 文章标签： python pytorch

本文链接：https://blog.csdn.net/Mr_deadline/article/details/113837382

版权

总结一个简单的自定义数据集示例

假设数据文件存储在path中的txt文件中，内容为【时间，数据1，数据2，数据3】的列表

对应的标签存在label.txt中

from torch.utils.data import Dataset

# 自定义数据集，继承自Dataset类
# 必须包含__init__，__getitem__，__len__三个功能
class mydataset(Dataset):
    #初始化，调用自定义函数从文件中读入数据
    def __init__(self,path,labelfile):
        self.samples = self.get_samples(path)
        self.labels = self.read_data(labelfile)
    #从定义完的数据集中取样本，返回索引值对应的特征和标签
    def __getitem__(self, index):
        return self.samples[index], self.labels[index]
    #数据集总样本数
    def __len__(self):
        return len(self.labels)

    def get_samples(self,path):
        filelist = os.listdir(path)
        sample_list = []
        for file in filelist:
            with open(path + file, 'r')as f:
                data = f.readlines()
            sample_one = []

最低0.47元/天解锁文章

Mr_deadline

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
零基础自定义数据集入门示例

总结一个简单的自定义数据集示例假设数据文件存储在path中的txt文件中，内容为【时间，数据1，数据2，数据3】的列表对应的标签存在label.txt中from torch.utils.data import Dataset# 自定义数据集，继承自Dataset类# 必须包含__init__，__getitem__，__len__三个功能class mydataset(Dataset): #初始化，调用自定义函数从文件中读入数据 def __init__(self,pa
复制链接

扫一扫

专栏目录