利用CNN进行句子分类的敏感性分析

最新推荐文章于 2022-08-23 10:19:10 发布

contr4l_

最新推荐文章于 2022-08-23 10:19:10 发布

阅读量2.9k

点赞数

分类专栏： NLP MachineLearning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/contr4l_/article/details/84256947

版权

MachineLearning 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

原文标题

A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for Sentence Classiﬁcation

Introduction

与逻辑回归、SVM相比，在文本分析中CNN应用困难的原因在于存在太多人为确定的超参。
CNN训练缓慢——在SST-1数据集上，进行10-fold交叉验证训练需要1个小时
可能的超参和模型结构太多，至少需要确定：词向量表达式、过滤层尺寸、特征数、激活函数、池化策略、正则项。
调参的优化方法包括：随机搜索、贝叶斯优化，但这些方法需要明确开始调整的参数和调整范围。
本工作致力于从经验上确定一些和数据集无关的超参的最佳取值，以及所有超参最佳的取值范围。
本文介绍了不同的超参设置在9个文本数据集上的训练结果，准确性以AUC和平均准确率的方式呈现。

Background

目前使用CNN进行本文分类的输入均使用词向量或词嵌入
设一个句子长度为s，词向量长度为d，则一个句子对应的矩阵A∈R^{s*d}
对于一个filter，显然其是一个d*h的矩阵，h为region size
从A中选取连续的h行（即连续的h个单词），则oi=w·A[i:i+h-1]，输出为d*d的矩阵，显然共有s-h+1个o
对应的特征矩阵为ci = f(oi+b)
可见特征矩阵的维度和句子的长度以及region size有关，因此在训练之前还需要进行池化
常用的池化方法：1-max pooling，而后将各个filter对应的池化结果串联，作为一个单独的特征向量。
而后通过soft-max，计算分类结果，同时可使用dropout进行正则化防止
损失函数：交叉熵绝对值，涉及的参数是filter的权重矩阵、计算feature map c的偏差矩阵，以及soft-max的权重矩阵。

Baseline Model

bowSVM: unigram and bigram features; wvSVM: average word vector; bowwvVM: concatenates bow vectors with average word2vec representations.
word2vec, GloVe
tuned hyperparameters via nested cross-fold validation

Effect

词向量的影响

One-hot 词向量+单层CNN在文本分类上取得了好成绩，但在句分类上表现较差。
结论：当训练数据足够时，使用embedding的效果是好的

Region size的影响

常规的region size最优取值是1~10
对于句子长度较长的情况，要相应增加
可以使用combine several region sizes的方法获得更好的结果

Number of feature maps的影响

当特征数超过600时，会发生过拟合

激活函数的影响

ReLU、tanh、Sigmoid、SoftPlus、Cube、tanh Cube、以及No function
整体来看，tanh的表现要优于ReLU，，甚至Iden（无函数）都要更好
ReLU能够加速SGD收敛
当有多层隐藏层时，Iden将不再合适

池化策略的影响

1-max pooling是最好的

正则化的影响

Drop out+L2 范数约束
改变drop out rate, 固定L2 norm为常数
结论：没有太大影响，建议rate在0到0.5之间，非0，以及使用较大的L2限制

结论

word2vec、GloVe都要比one-hot好
filter region size是调参的重点之一
feature maps number也是调参重点
1-max pooling和Regularization相对影响较小
建议使用non-static embeddings
当增加feature maps number时，使用更大的正则化参数

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。