【每周一文】Convolutional Neural Network for text/sentence classification（2016）

最新推荐文章于 2024-08-05 11:09:30 发布

下一步

最新推荐文章于 2024-08-05 11:09:30 发布

阅读量6.1k

点赞数 2

分类专栏：深度学习每周一文 NLP 文章标签： CNN NLP 分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fangqingan_java/article/details/51559758

版权

本文探讨了卷积神经网络（CNN）在自然语言处理（NLP）中的文本分类任务，包括句子分类、短文本分类和长文本分类。CNN的优势在于捕捉局部信息和处理不定长输入，使用预训练的词向量能提升效果。文章介绍了不同的模型架构，如使用字向量处理短文本，字符级别的CNN处理长文本，并强调了模型深度和训练数据的重要性。

摘要由CSDN通过智能技术生成

概述

卷积神经网络（CNN）相比于基于词袋模型的DNN有以下优点：
1. 能够捕获局部的位置信息
2. 能够方便的将不定长的输入转换成定长输入接入到DNN网络中
3. 相比于RNN模型计算复杂度低，在很多任务中取得不错的效果。

在自然语言处理（NLP）的分类任务中，文本分类或者句子分类也能表现比较好的效果，甚至达到state of art效果。

另外如果借助于预训练的词向量、字向量或者字符向量效果更佳。

本文介绍CNN在分类任务中应用模式。

文本分类应用

句子分类

借助词向量将句子表示成二维矩阵，直接套用经典的CNN框架。可以调节的超参数包括词向量长度以及算法、区域大小、过滤器个数、pooling层策略、正则项

基础架构如下：
这里写图片描述

介绍如下

上图展示的是两个频道的向量表示作为输入，一个卷积层一个pooling层最后跟多个全连接层。

两个频道层，可以理解层两个不同算法的词向量表示，或者一个算法一个频道保持静态，即不作为参数改变，另外一个频道根据特定模型进行细粒度调优。

卷积层可以选择一个region的多个过滤器，或者不同宽度的过滤器进行卷积操作

pooling层常常选择max-pooling就能达到非常好的效果。

短文本分类

借助于字向量、字符向量对短文本进行建模，从而得到句子级别的向量表示，最后用于分类问题，在情感分析中取得较好的效果。

建模流程为

对于输入句子包含n个词 w1,

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。