CNN在中文文本分类的应用

最新推荐文章于 2023-12-30 22:57:31 发布

大愚若智_

最新推荐文章于 2023-12-30 22:57:31 发布

阅读量3w

点赞数 18

分类专栏： Algorithm 文章标签： cnn 深度学习 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zbc1090549839/article/details/53055386

版权

本文探讨了CNN如何应用于中文文本分类任务，详细介绍了CNN模型的四部分结构：输入层、卷积层、池化层和全连接+softmax层。在训练过程中采用了Dropout和L2正则化防止过拟合，并使用minibatch和shuffle_batch优化样本处理。实验使用搜狗语料库，调整word vector size和feature maps size得到不错的效果。

摘要由CSDN通过智能技术生成

深度学习近一段时间以来在图像处理和NLP任务上都取得了不俗的成绩。通常，图像处理的任务是借助CNN来完成的，其特有的卷积、池化结构能够提取图像中各种不同程度的纹理、结构，并最终结合全连接网络实现信息的汇总和输出。RNN由于其记忆功能为处理NLP中的上下文提供了途径。

在短文本分析任务中，由于句子句长长度有限、结构紧凑、能够独立表达意思，使得CNN在处理这一类问题上成为可能。论文Convolutional Neural Networks for Sentence Classification(论文作者Yoon Kim)即在这一类问题上做了尝试。首先来看看论文中介绍的模型结构及原理：

CNN模型结构如下：

一共包括4部分：

1、输入层：

如图所示，输入层是句子中的词语对应的wordvector依次（从上到下）排列的矩阵，假设句子有 n 个词，vector的维数为 k ，那么这个矩阵就是 n × k 的(在CNN中可以看作一副高度为n、宽度为k的图像)。

最低0.47元/天解锁文章

关注

18
点赞
踩
65

收藏

觉得还不错? 一键收藏
32
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 32

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。