pytorch深度学习笔记

该代码段主要实现了从数据字典中按比例切分训练集、测试集和验证集的功能。通过随机采样和可选的增强采样(编码)策略,对每个文件的样本进行处理,并将结果存储在对应的字典中。切片比例、采样数量和编码步长均可调整。
摘要由CSDN通过智能技术生成

首先说明,这是学习过程中的服务于自己的笔记,如有问题,欢迎大家批评指正,不胜感激

def slice_data(data, length=864, number=1000, slice_rate=[0.7, 0.2, 0.1], enc=True, enc_step=28):
    train_samples = {} #用于存放所有文件的切片结果,每个文件的样本对应字典中一个元素,作为训练集
    test_and_valid_samples = {} #用于存放训练集
    keys = data.keys() #获取字典的所有键值
    #通过遍历健实现遍历所有数据,先采集训练样本,后采集测试样本和验证样本
    for key in keys:
        train_data = [] #临时存储切片得到的训练样本
        total_length = len(data[key]) #数据的总长度
        end_index = int(total_length * slice_rate[0]) #采集训练样本时,只能采集到前面训练样本所占比例,相当于把整个数据集也分为了训练集、测试集、验证集,至于开始采样的位置由随机数确定
        train_num = int(number * slice_rate[0]) #获取训练样本总数量 一定要强制类型转换为整数,不然后面使用==判断就会出现问题
        if enc:
            enc_times = length // enc_step #在一个length里需要增强采集的次数
            steps = 0 #记录采样次数,采样到达train_num停止
            for j in range(train_num):
                label = False #标志位,用于确定是
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值