【NLP_模型超参数浅析】batchsize

YWP_2016

已于 2022-05-03 15:29:43 修改

阅读量1.4k

点赞数 4

分类专栏： NLP 文章标签： NLP 调参

于 2021-04-04 11:22:05 首次发布

本文链接：https://blog.csdn.net/YWP_2016/article/details/115426577

版权

NLP 专栏收录该内容

36 篇文章 9 订阅

订阅专栏

问题及解决

问题：明明已经设置“batch_size = 16”，训练数据量在300-400条，但在运行代码，实际训练时，仍全批量训练，未分批次：

Epoch 1/500

1/1 ……

解决：检查数据，是否按照代码中定义的那样（ for c in l.split('\n'):），以换行符分隔每条数据。


def load_data(filename): #加载标注数据：训练集、测试集与验证集
    D = [] 
    with open(filename, encoding='utf-8') as f: #打开并读取文件内容
        f = f.read() #读取文件全部内容
        for l in f.split('\n\n'): #查找双换行符
            if not l: #若无双换行符
                continue #跳出本次循环，可执行下一次 （而break是跳出整个循环）

            d, last_flag = [], ''
            for c in l.split('\n'): #######################查找换行符
                char, this_flag = c.split(' ') 
                if this_flag == 'O' and last_flag == 'O': 
                    d[-1][0] += char #d[-1][0]=d[-1][0]+char
                elif this_flag == 'O' and last_flag != 'O':
                    d.append([char, 'O'])
                elif this_flag[:1] == 'B': 
                    d.append([char, this_flag[2:]])
                else:
                    d[-1][0] += char 
                last_flag = this_flag
            D.append(d)
    return D

所用数据是用换行符+空格分隔数据，将空格去除即可。

浅析Batchsize

Batchsize设置为1，即随机梯度下降(Stochastic Gradient Descent, SGD)，一个样本算出的梯度来更新每一步。
Batchsize设置为训练数据量，全批量训练，即批梯度下降（Batch gradient descent, BGD) ，所有样本算出的梯度的平均值来更新每一步。
一般将Batchsize设置为16,32,64……至于Batchsize设置大值/小值更好，众说纷纭。怎么选取训练神经网络时的Batch size? 怎么选取训练神经网络时的Batch size? - 知乎

YWP_2016

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
【NLP_模型超参数浅析】batchsize

问题及解决问题：明明已经设置“batch_size = 16”，训练数据量在300-400条，但在运行代码，实际训练时，仍全批量训练，未分批次：Epoch 1/5001/1 ……解决：检查所用数据，是否按照代码中定义的那样（for c in l.split('\n'): #######################查找换行符），以换行符分隔每条数据。def load_data(filename): #加载标注数据：训练集、测试集与验证集 D = [] w...
复制链接

扫一扫