Hierarchical Attention Networks for Document Classiﬁcation学习笔记

最新推荐文章于 2023-03-18 10:19:32 发布

Doron15

最新推荐文章于 2023-03-18 10:19:32 发布

阅读量1.6k

点赞数 1

分类专栏：论文笔记文章标签： HAN NLP Document Classification

本文链接：https://blog.csdn.net/Doron15/article/details/81771623

版权

这篇博客详细介绍了Hierarchical Attention Networks（HAN）的工作原理，包括基于GRU的序列编码器、层次化的单词和句子Attention机制，以及如何应用于文本分类。HAN通过上下文感知的注意力机制在单词和句子层面对文本进行重要性加权，从而提升文本表示的质量，提高文本分类性能。

摘要由CSDN通过智能技术生成

Hierarchical Attention Networks for Document Classiﬁcation学习笔记

这篇博客是在阅读了 Hierarchical Attention Networks for Document Classiﬁcation 这篇论文之后所做的总结体会，若有任何不准确的地方，烦请大家斧正。
[TOC]

0. 概述

这篇论文提出了一个用于文本分类的层次化Attention网络。这个模型有两个鲜明的特点：
1. 它有类似于文本层次结构的层次结构。
2. 它有两个层次化的attention机制，分别应用于单词水平和句子水平，使它能够在建立文本表示的时候对不同重要性的内容倾注不同注意力。
这篇论文的主要贡献就在于这个新的神经结构，the Hierarchical Attention Network（HAN）。这个结构是迎合有关文本结构的两种主要观点：
1. 因为文本有分层结构（句子中的单词，文本中的句子），同样地，通过先建立句子的表示，然后再把它们聚合成文本的表示。
2. 文本中不同的单词和句子信息量不同。另外，单词和句子的重要性是高度依赖上下文的，同一个单词或者句子在不同的上下文里可能重要性就不同。因此，该模型包含了两个层次的attention机制——单词和句子。
与前人研究的关键不同在于此系统使用上下文来发现标志序列何时相关，而不是简单的过滤标志（序列），脱离了上下文。

1. HAN网络

HAN的整体结构如下图展示，包含四个部分

最低0.47元/天解锁文章

Doron15

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hierarchical Attention Networks for Document Classiﬁcation学习笔记

Hierarchical Attention Networks for Document Classiﬁcation学习笔记这篇博客是在阅读了 Hierarchical Attention Networks for Document Classiﬁcation 这篇论文之后所做的总结体会，若有任何不准确的地方，烦请大家斧正。 [TOC]0. 概述这篇论文提出了一个用于文本分类的层次化...
复制链接

扫一扫

专栏目录