论文Convolutional Naural Networks for Sentence Classification--模型介绍篇

最新推荐文章于 2022-10-13 22:41:55 发布

liuchongee

最新推荐文章于 2022-10-13 22:41:55 发布

阅读量6.5k

点赞数 1

分类专栏： nlp 深度学习卷积神经网络-CNN 深度学习与NLP--论文笔记和TensorFlow实现文章标签： cnn nlp 深度学习文本分类

本文链接：https://blog.csdn.net/liuchonge/article/details/60328365

版权

本文介绍了Yoon Kim的论文《Convolutional Naural Networks for Sentence Classification》，探讨了将CNN应用于NLP，尤其是文本分类的任务。论文中提出的模型包含输入层、卷积层、池化层和全连接层，通过词向量表示句子，利用不同大小的卷积核捕获词序信息。过拟合问题通过dropout和L2正则化来缓解。模型在电影评价分类任务中表现出色，为后续研究设定了基准。

摘要由CSDN通过智能技术生成

最近读了Yoon Kim发表的Convolutional Naural Networks for Sentence Classification一文。这是一篇将CNN和NLP结合的文章，接下来我们会分模型介绍和代码实现两部分来介绍该论文。

论文所提出的模型结构如下图所示：
这里写图片描述
1，这里的输入层显示有两个channel，其实我们可以看作是一个，因为后文中说到这两个channel分别是static和non-static，即使用的词向量是否随着训练发生变化。non-static就是词向量随着模型训练变化（Fine tune），这样的好处是词向量可以根据数据集做适当调整，但是CS224d课程里也说过当数据集较小时不推荐此操作，否则容易产生过拟合现象。static就是直接使用word2vec训练好的词向量即可。此外，由图可知，输入层是将一个句子所有单词（padding）的词向量进行拼接成一个矩阵，每一行代表一个词。