【论文笔记】文本分类(text classification)论文整理

最新推荐文章于 2022-12-25 15:51:14 发布

theoreoeater

最新推荐文章于 2022-12-25 15:51:14 发布

阅读量5.2k

点赞数

分类专栏：论文笔记自然语言处理文章标签：文本分类 NLP 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39837402/article/details/80197269

版权

自然语言处理同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

7 篇文章 2 订阅

订阅专栏

Distributed Representations of Sentences and Documents

这篇文章借鉴了word2vec的方法来训练长文本向量，如句子，段落，文档。首先随机初始化文本向量和文本中词的词向量，利用skip-gram和CBOW模型（在文中称为PV_DM和PV_DBOW模型）一起训练词向量和文本向量。

论文链接：https://cs.stanford.edu/~quocle/paragraph_vector.pdf

PV-DM：

PV-Dbow：

最后将两个模型训练得到的文本向量结合作为最终的文本向量，利用文本向量可继续做更高级的任务，如文本分类，情感分析等。

HierarchicalAttention Networks for Document Classification

论文链接：https://www.cs.cmu.edu/%7Ediyiy/docs/naacl16.pdf

本文提出了层次注意力网络，该模型使用GRU对词语和句子分别进行编码，分为word encoder和sentence encoder，两个encoder拥有各自的attention model。

Word encoder：首先采用双向GRU对每个句子内的词语进行编码，连接两个GRU的最后一个时间步的隐层向量作为每个词语的向量表示，初始化一个上下文向量，通过计算上下文向量和每个词语的匹配度来得到每个词语的attention值，利用attention值得到句子内所有单词向量的加权和，就是最终该句子的向量表示，GRU、上下文向量、匹配函数的参数都会在训练中得到更新，

Sentence encoder：在得到各个句子的编码后采用相同的attention机制得到各句子向量的加权和，得到文档的向量表示，将该向量输入全连接层做文本分类，训练更新参数。

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【论文笔记】文本分类(text classification)论文整理

Distributed Representations of Sentences and Documents这篇文章借鉴了word2vec的方法来训练长文本向量，如句子，段落，文档。首先随机初始化文本向量和文本中词的词向量，利用skip-gram和CBOW模型（在文中称为PV_DM和PV_DBOW模型）一起训练词向量和文本向量。论文链接：https://cs.stanford.edu/~quocl...
复制链接

扫一扫

专栏目录

博客等级

码龄7年

30
原创

80
点赞

329
收藏

39
粉丝

关注

私信

分类专栏

最新评论

【因果学习】贝叶斯网络结构学习方法
於乎578: 不能满足假设的前提下那学习到的网络应该不能用于因果推断吧
【因果学习】贝叶斯网络结构学习方法
叶庭云: 【因果学习】贝叶斯网络结构学习方法。基于约束的方法、基于评分的方法、混合方法。总结得很好，给你点赞！
深度学习半自动化视频标注工具——VATIC使用教程
weixin_45995926: 不是/home/video，是home/user/video，你看文件属性可以查看路径
深度学习半自动化视频标注工具——VATIC使用教程
qq_41404818: 我也遇到这个问题了，改成这个 $"你的目录" 就可以啦
深度学习半自动化视频标注工具——VATIC使用教程
Evinn大帝: 你好，请问你解决了吗，万分感谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。