PyTorch Dataset Dataloader加载自定义多分类数据，重写Dataset类

最新推荐文章于 2024-08-06 15:18:37 发布

想远行的猪

最新推荐文章于 2024-08-06 15:18:37 发布

阅读量4.1k

点赞数 1

分类专栏：语种识别深度学习文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/tcd1112/article/details/98513040

版权

本文介绍了如何在PyTorch中创建自定义的Dataset类，用于加载多分类数据。通过继承`torch.data.dataset`并重写`__init__`, `__len__`和`__getitem__`方法，实现数据集的加载。同时，文章提到了`torch.utils.data.Dataset`及其相关类如TensorDataset、DataLoader等，讨论了数据处理和采样器的工作原理。" 121919356,7764378,Cesium动态立体墙着色器实现,"['cesium', '着色器', '3D建模', 'GIS应用']

摘要由CSDN通过智能技术生成

不多说，直接上源码

我做的是语种分类的项目，所以直接上了，里面有些介绍。

还是先简要介绍，继承torch.data.dataset，然后重写init、len和getitem方法。

代码如下：

import os
import torch
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np
import numpy.fft as fft
import cv2
import torchvision.transforms as transforms
from torch.utils import data
#librosa 简介，音频处理库
# 音频读取函数load()
# 重采样函数resample()
# 短时傅里叶变换stft()
# 幅度转换函数amplitude_to_db()
# 频率转换函数hz_to_mel()
# 频谱显示函数specshow()
# 波形显示函数waveplot()

class MyDataset(data.Dataset):
    def __init__(self, Path, second=1, transform=None, target_transform=None): #初始化一些需要传入的参数
        super(MyDataset,self).__init__()
        self.Path=Path
        self.classes = {"en":"0", "ru":"1", "yue":"2", "zh":"3"}
        melimgs = []
        for root1, dirs, files in sorted(os.