数据集类和数据加载器类

最新推荐文章于 2024-01-06 15:55:21 发布

小句

最新推荐文章于 2024-01-06 15:55:21 发布

阅读量104

点赞数

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/flamesfather/article/details/115495455

版权

pytorch 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

# 数据集类的使用
# http://archive.ics.uci.edu/ml/datasets/SMS+Spam+Collection
import torch
from torch.utils.data import Dataset, DataLoader
import math

data_path = r"D:\下载内容\smsspamcollection\SMSSpamCollection"


# 完成数据集类
class MyDataset(Dataset):
    def __init__(self):
        self.lines = open(data_path, encoding='gb18030', errors='ignore').readlines()

    def __getitem__(self, index):
        # 获取索引对应位置的一条数据
        cur_line = self.lines[index].strip()
        label = cur_line[:4].strip()
        content = cur_line[4:].strip()
        return label, content

    def __len__(self):
        return len(self.lines)


my_dataset = MyDataset()

data_loader = DataLoader(dataset=my_dataset, batch_size=2, shuffle=True,drop_last=True)

if __name__ == '__main__':
    # print(my_dataset[1000])
    # print(len(my_dataset))
    for i in data_loader:
        print(i)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小句

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据集类和数据加载器类

# 数据集类的使用# http://archive.ics.uci.edu/ml/datasets/SMS+Spam+Collectionimport torchfrom torch.utils.data import Dataset, DataLoaderimport mathdata_path = r"D:\下载内容\smsspamcollection\SMSSpamCollection"# 完成数据集类class MyDataset(Dataset): def __init
复制链接

扫一扫