A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification之每日一篇

最新推荐文章于 2020-02-19 22:08:57 发布

gentelyang

最新推荐文章于 2020-02-19 22:08:57 发布

阅读量371

点赞数

分类专栏： NLP 文章标签： CNN NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gentelyang/article/details/80829614

版权

NLP 专栏收录该内容

26 篇文章 2 订阅

订阅专栏

论文Convolutional neural networks for sentence classification，这篇文章已经介绍过了，它介绍了如何使用CNN做句子分类（文本分类）；而本文主要介绍了用CNN做句子分类的时的一些经验，如何调节超参。

超参数包括：词向量，Region size大小，feature map的数量，激活函，pooling，正则化的影响。

模型图：

词向量：

词向量的表示形式主要有两种。1：one-hot表示；2：Distribution Representation。

one-hot不多说了，得到的是稀疏高维的向量。

Distribution Representation有两种训练方法：一种是word2vec，另一种是Glove。有实验表明这两种效果差不多，但是

个人感觉Glove效果应该更好些才对。

Region Size

对不同的数据，都有不同的最优Region Size,我们往往会组合不同size的Region来进行融合，而且经验表明，组合的size跟最优size的越接近，最终的效果往往会更好。而且并不是说，一定要所有的size都是要最优size。

所以刚开始，我们可以只用一个filter，调节Region Size来比对各自的效果，来看看那种size有最好的表现，然后在这个范围在调节不同Region的匹配。

feature map数量

在论文中作者提到Feature Map的数量一旦超过600，效果就会变得不好。作者的建议是Feature Map的数量控制在100-600

激活函数

比对了多种不同的激活函数，最终的结论是Relu函数，tanh函数，以及不加任何激活函数的表达都是不错的。

Pooling方法

1-max pooling方法效果比较好，作者推荐这种方法。

Regularization

dropout在0-0.5时的效果比较好。

l2 norm 对性能没有帮助，但是比较耗时，所以不建议使用。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。