python实现胶囊网络_胶囊网络（Capsule Network）在文本分类中的探索

最新推荐文章于 2024-05-09 09:34:51 发布

那个吴小明

最新推荐文章于 2024-05-09 09:34:51 发布

阅读量878

点赞数

文章标签： python实现胶囊网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33102135/article/details/113979365

版权

作者丨杨敏

单位丨中国科学院深圳先进技术研究院助理研究员

研究方向丨自然语言处理

文本建模方法大致可以分为两类：(1) 忽略词序、对文本进行浅层语义建模 (代表模型包括 LDA，EarthMover’s distance等); (2) 考虑词序、对文本进行深层语义建模 (深度学习算法，代表模型包括 LSTM，CNN 等)。

在深度学习模型中，空间模式(spatial patterns)汇总在较低层，有助于表示更高层的概念(concepts)。例如，CNN 建立卷积特征检测器提取来自局部序列窗口的模式，并使用 max-pooling 来选择最明显的特征。然后，CNN 分层地提取不同层次的特征模式。

然而， CNN 在对空间信息进行建模时，需要对特征检测器进行复制，降低了模型的效率。正如(Sabouret al, 2017)所论证的那样，这类方法所需复制的特征检测器的个数或所需的有标签训练数据的数量随数据维度呈指数增长。

另一方面，空间不敏感的方法不可避免地受限于丰富的文本结构 (比如保存单词的位置信息、语义信息、语法结构等)，难以有效地进行编码且缺乏文本表达能力。

最近，Hinton 老师等提出了胶囊网络(Capsule Network), 用神经元向量代替传统神经网络的单个神经元节点，以 Dynamic Routing 的方式去训练这种全新的神经网络，有效地改善了上述两类方法的缺点。

正如在人类的视觉系统的推理过程中，可以智能地

最低0.47元/天解锁文章

那个吴小明

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python实现胶囊网络_胶囊网络（Capsule Network）在文本分类中的探索

作者丨杨敏单位丨中国科学院深圳先进技术研究院助理研究员研究方向丨自然语言处理文本建模方法大致可以分为两类：(1) 忽略词序、对文本进行浅层语义建模 (代表模型包括 LDA，EarthMover’s distance等); (2) 考虑词序、对文本进行深层语义建模 (深度学习算法，代表模型包括 LSTM，CNN 等)。在深度学习模型中，空间模式(spatial patterns)汇总在较低层，有助于...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。