卷积神经网络（CNN）应用于自然语言处理（NLP）

最新推荐文章于 2024-06-02 22:19:32 发布

樱夕夕

最新推荐文章于 2024-06-02 22:19:32 发布

阅读量7.6k

点赞数 6

分类专栏： NLP 文章标签：自然语言处理 cnn 神经网络 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21460525/article/details/62216395

版权

说到CNN，大家自然想到图像处理。
说到NLP，大家自然想到LSTM，RNN。
但是，去年的斯坦福论文表明，CNN照样可以应用于NLP，并且效果可能更好。

博主做了实验，爬取了各类新闻并对新闻进行分类。这样的分类问题，RNN和CNN都可以达到99%左右的效果，但是，CNN几乎比RNN快了5倍。于是，博主主要针对CNN对于NLP处理中的细节展开讨论。

1.CNN为什么可以处理NLP
随着词向量的发展，word2vec,Glove等现有的词向量库已经能较好的表达词语的含义。因此，我们用N维-词向量就可以度量词语之间的距离，想象N维空间，每个词语是其中的一点。

2.CNN做NLP，输入是什么？
作为卷积操作，类似于图像，输入也是一个二维矩阵，（图像可以说是三维的，因为还有一维是通道数吧）。然后每一行是一个词语的向量，每个输入的二维矩阵就是M个词语，N维度的词向量组成的M*N的矩阵。

3.CNN做NLP，怎么卷积？
选择好了输入，接下来就是卷积。不同于图像处理的卷积，CNN对NLP的卷积核大小有要求，一般来说，卷积核的长度和词向量的维度应该是一致的。比如一个词向量是N维的，那么卷积核就应该是X*N维的，我一般X取（1，2，3。借鉴斯坦福论文）。所以卷积就是提取1个词、2个词、3个词之间的特征。

4.CNN做NLP，还要注意啥？
比如双通道的输入。一般的embedding-layer是可训练的，我使用的模型是2-embedding-layer，一

最低0.47元/天解锁文章

关注

6
点赞
踩
36

收藏

觉得还不错? 一键收藏
1
评论
卷积神经网络（CNN）应用于自然语言处理（NLP）

说到CNN，大家自然想到图像处理。说到NLP，大家自然想到LSTM，RNN。但是，去年的斯坦福论文表明，CNN照样可以应用于NLP，并且效果可能更好。博主做了实验，爬取了各类新闻并对新闻进行分类。这样的分类问题，RNN和CNN都可以达到99%左右的效果，但是，CNN几乎比RNN快了5倍。于是，博主主要针对CNN对于NLP处理中的细节展开讨论。1.CNN为什么可以处理NLP 随着词向量的发展
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。