注意力机制

最新推荐文章于 2023-11-07 14:25:38 发布

ww要努力呀

最新推荐文章于 2023-11-07 14:25:38 发布

阅读量602

点赞数

分类专栏： nlp 文章标签： 1024程序员节自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wwang_123/article/details/127487744

版权

nlp 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章目录

注意力机制概述
传统注意力机制
注意力编码机制

注意力机制概述

什么是注意力机制？

加权求和机制/模块

传统注意力机制

加权求和模块：神经网络中的一个组件，可以单独使用，但更多地用作网络中的一部分。

注意力模型结构

输入：Q,K
输出：Att-V
功能：对于集合K，求相对Q各个元素的权重，然后按权重相加形成Q要的结果

步骤：
1、计算f(Q,K)

2、 $softmax(f(Q,K_{i}))$ （计算对于Q各个Ki的权重）
3、计算输出（各Ki乘以自己的权重，然后求和）

注意力模块训练

将模块放入整体模型中，不需要额外的训练数据权重可以由模块中的参数学到

注意力模块评价

放到各个任务中检验，通过任务指标的提升证明模块的效果

注意力模块应用

应用场景：网络中有“求和”的地方都可以用
优点：

根据不同场景动态选择不同的关注对象
不考虑词之间的距离直接计算依赖关系，提升任务性能

作用：等权处理->加权处理->提升任务效果

软注意力Soft Attention

在求注意力分配概率分布的时候，对于输入句子X中任意一个单词都给出个概率，是个概率分布

硬注意力Hard Attention

直接从输入句子里面找到某个特定的单词，然后把目标句子单词和这个单词对齐，而其他输入句子中的单词硬性地认为对齐概率为0

全局注意力Global Attention

考虑所有词，全为k

局部注意力Local Attention

本质是Soft AM和Hard AM的一个混合或折衷，选一部分为k

注意力编码机制

通过建立序列各元素之间的关联关系形成一种序列表示（按元素之间关系对序列进行编码）；或通过不同序列元素之间的关联关系形成不同序列间的融合表示

注意力机制作为编码机制主要有：
1、单一向量编码：将输入序列按规则编码成单一向量表示
2、不同序列间编码：将2个序列编码成二者的融合的表示序列
3、同一序列自编码：利用多头自注意力编码对一个句子编码可以起到类似句法分析器的作用

单一向量编码

通过建立序列K各元素与Q之间的关联关系形成单一向量表示（按元素之间关系对序列进行编码）

Q为确定值的句向量编码（句表示）
Q为隐变量的句向量编码（句表示）,可根据需要设定, 可以是变量
对序列中某元素的真正上下文编码（词编码）

不同序列间编码

将二个序列编码成二者的融合的表示序列（如，匹配任务和阅读理解任务常用的融合层表示）

同一序列自编码

利用多头自注意力编码对一个句子编码可以起到类似句法分析器的作用
Q=K=V

多头注意力机制：
多头（Multi-Head）就是做多次同样的事情（参数不共享），然后把结果拼接

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
注意力机制

自然语言处理注意力机制相关记录
复制链接

扫一扫

专栏目录

ww要努力呀 CSDN认证博客专家 CSDN认证企业博客

码龄2年

86: 原创

23万+: 周排名

3万+: 总排名

4万+: 访问

: 等级

1280: 积分

528: 粉丝

400: 获赞

4: 评论

436: 收藏

私信

关注

热门文章

分类专栏

前端 3篇
React 1篇
各种报错 2篇
机器学习 9篇
复习内容 10篇
Java 14篇
go 12篇
nlp 11篇
计算机网络 4篇
python 8篇

最新评论

python的一些库
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
客户端web开发工具
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
python中将print的内容输出到日志文件中
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。相比 loguru 有10胜。 pip install nb_log 。
go语言学习——2
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614910496。
pytorch学习记录
CSDN-Ada助手: 书山有路勤为径，学海无涯苦作舟，加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。