深度学习-图像分类篇二：注意力机制

最新推荐文章于 2023-12-27 01:59:52 发布

捣蛋老爷

最新推荐文章于 2023-12-27 01:59:52 发布

阅读量547

点赞数

分类专栏： # 图像分类文章标签：深度学习分类人工智能

本文链接：https://blog.csdn.net/hukou6335490/article/details/130792982

版权

4 篇文章 0 订阅

订阅专栏

在这里插入图片描述

不同任务（李宏毅的注意力机制）
- 1.输入n输出n：sequence labeling
- 2.输入n输出1：标签
  -3. 输入n输出m：seq2seq
针对sequence labeling问题可以开一个window把附近的词都考虑到，例如：I saw a saw标记词性，但这样window很大会带来很多参数和overfit，所以引入注意力self-attention
找到与自己相关的每个词的相关性，注意重要的信息
注意整个计算过程是可以并行的
矩阵的角度思考
- qkv的计算，每一个a都要产生对应的qkv，w权重是学出来的
- 计算相似度的本质是向量的内积（点乘）：
总结self-attention
- 找出qkv：使用学习的权重
- 找到相关性的得到weight
- 最后对v做加权和（weighted sum）