Attention model

最新推荐文章于 2022-08-09 14:55:29 发布

喜欢爱喝矿泉水的男孩

最新推荐文章于 2022-08-09 14:55:29 发布

阅读量303

点赞数 2

分类专栏：深度学习文章标签： Attention model 自然语言处理深度学习人工智能

本文链接：https://blog.csdn.net/qq_40900196/article/details/88997857

版权

深度学习专栏收录该内容

20 篇文章 2 订阅

订阅专栏

Attention model

Attention 机制在语音识别、机器翻译和词性标注等序列化数据中表现非凡，attention 机制可以单独使用，也可以在其他混合模型中作为其他混合模型的层使用，可以放在文本向量输入层之后也可以放在其他网络模型训练数据之后，通过对数据进行自动加权变换，把两个不同的部分联系起来，突出重点的词语，使整个系统表现出更好的性能。Attention 机制类似人脑的观察某些事物的原理，如人们为了描述某些画的内容而去观察某幅画，首先会观察这幅画上的题的字，然后根据判断有目的地去观察这幅图中表现主题的那部分内容；当去描述这幅画时，往往会先描述与这幅画最相关的内容，然后再去描述其他方面的内容；attention 机制就是一种通过在关键信息上分配足够的关注、突出局部重要信息的机制。attention 机制通常可以分为两类：时间 attention 机制和空间 attention 机制，本文用到的主要是时间注意力。attention 机制是一种类似人脑的注意力资源分配机制，通过概率权重分配的方式，计算不同时刻词向量的概率权重，使一些词语能够得到更多的关注，从而提高该隐藏层特征提取的质量。Attention model 基本结构如图 5 所示。