短文本分类的 ResLCNN 模型

最新推荐文章于 2024-06-07 14:54:06 发布

gentelyang

最新推荐文章于 2024-06-07 14:54:06 发布

阅读量3.4k

点赞数

分类专栏： NLP 文章标签： CNN LSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gentelyang/article/details/80840585

版权

NLP 专栏收录该内容

26 篇文章 2 订阅

订阅专栏

收稿时间: 2017-06-30; 采用时间: 2017-10-20

Journal of Software

在 He 等人研究中,34 层的 CNN 比 18 层的 CNN 效果差.同样,在 Donahue 等人研究中也提到,双层的 LSTM 模型效果是最好的,多层的 LSTM 效果出现退化现象.为解决此退化问题,He 等人[8]提出了残差网络.受此启发,为了提高模型性能。

ResLCNN模型以word2vec和Glove词向量构成的句子矩阵作为输入。第1层根据隐藏层和记忆单元获取文本时序特征，随后

用残差层包含两层LSTM，接着CNN使用多个卷积核进行进行卷积运算，提取最优卷积特征，通过softmax分类，

类.ResLCNN 模型为了获取更复杂的特征,将 3 层 LSTM 结合 CNN 构建深层网络,同时在第 1 层 LSTM 输出与 CNN 层输入之间添加恒等映射,构建残差层缓解训练模型阶段低网络层梯度消失问题.

模型结构图：

数据集：影评数据集MR

该数据集包括相同数量的正面和负面评论,共 10 662 条,每条评论都是一条短句.实验中训练集、验证集和测试集的比例是 8:1:1.

模型参数：

LSTM大小均为300，CNN卷积核大小为3，数量100，relu和sigmoid，使用bn和dropout操作，

利用adadelta梯度下降法。

论文思路不错所以整理一下，利用到了ResNet的思想，并将LSTM与CNN结合起来，将LSTM的输出输入到CNN。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
短文本分类的 ResLCNN 模型

收稿时间: 2017-06-30; 采用时间: 2017-10-20Journal of Software在 He 等人研究中,34 层的 CNN 比 18 层的 CNN 效果差.同样,在 Donahue 等人研究中也提到,双层的 LSTM 模型效果是最好的,多层的 LSTM 效果出现退化现象.为解决此退化问题,He 等人[8]提出了残差网络.受此启发,为了提高模型性能。ResLCNN模型以wor...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。