Deep Learning for Extreme Multi-label Text Classification阅读笔记

最新推荐文章于 2023-04-19 11:13:27 发布

Leokb24

最新推荐文章于 2023-04-19 11:13:27 发布

阅读量3.3k

点赞数

分类专栏：论文阅读文本分类论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leo_95/article/details/90553079

版权

文章目录

概述
模型
实验
- 参数设置
- 实验结果

概述

Extreme multi-label就是说总的标签量非常多, 成千上万甚至数百万.
Extreme multi-label text classification主要难点在于数据稀疏, 并且计算量较大(标签太多).
本文作者对textcnn进行改进, 使其在extreme multi-label text classification问题上获得更好的效果.

模型

在这里插入图片描述
模型是基于text-cnn改进的.
创新点:

dynamic max pooling.
改进了损失函数
在pooling和输出层之间加了一个bottleneck layer, 减小模型规模, 加快训练.

Dynamic max pooling

text-cnn是对每个feature map做max pooling, 所以每个feature在pooling之后只得到一个特征.
作者认为, 这样做pooling, 如果句子很长, 会损失很多信息, 并且没有利用任何位置信息.

对此, 作者提出使用Dynamic max pooling, 对于每个feature map, pooling生成p个特征. 具体做法如下,

对于一个包含m个词的句子, 把这个句子分成p块, 每一块分别做max-pooling然后进行拼接.

损失函数

损失函数使用binary cross-entropy, 而不是 softmax cross-entropy

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Deep Learning for Extreme Multi-label Text Classification阅读笔记

文章目录概述模型Dynamic max poolingHidden Bottleneck layer概述Extreme multi-label就是说总的标签量非常多, 成千上万甚至数百万.Extreme multi-label text classification主要难点在于数据稀疏, 并且计算量较大(标签太多).本文作者对textcnn进行改进, 使其在extreme multi-la...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。