图像描述的注意力可视化

枉费红笺

已于 2023-05-04 20:39:18 修改

阅读量5k

点赞数 2

分类专栏： Python 深度学习图像描述文章标签：计算机视觉深度学习 python 人工智能

于 2022-09-16 11:13:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46707326/article/details/126885082

版权

深度学习同时被 3 个专栏收录

10 篇文章

订阅专栏

4 篇文章

订阅专栏

3 篇文章

订阅专栏

深度学习的模型和训练过程对我们来说如同一个黑匣子，可解释性不强，此时可视化的重要性愈发凸显；同时在我们的实验结果分析里，除了一些冷冰冰的数据支撑之外，可视化的展示也可以更直观地让读者感受到模型的效果。常规的可视化包括：模型结构的可视化、卷积参数的可视化、训练过程的可视化、热图可视化等。今天给大家介绍一种实现注意力可视化的代码（以图像描述为例）

注意力机制实际上就是想将人的感知方式、注意力的行为应用在机器上，让机器学会去感知数据中的重要和不重要的部分。例如当我们看到一幅图像时，在某个时间段眼睛会聚焦在图像的某一区域，此时会重点关注这一部分而忽视其他部分，注意力就是让模型拥有同样的功能。

我们理论上可以解释的通，但注意力在模型的训练过程中到底是怎么作用的呢？

此时就需要进行注意力的可视化展示，图像描述的可视化效果如下图所示，当我们生成或预测某个单词时，注意力就会重点关注图像中相应的区域，可以更直观的让我们感受的注意力到底是什么东西，它在我们模型的训练过程中以一种什么样的作用存在。

在这里插入图片描述

那么上面效果图如何实现的呢？下面简单描述一下流程：

首先给定图像，模型等一些参数
然后加载模型、字典，对图像进行预处理等
根据图像和模型得到图像的描述句子以及生成描述过程中的注意力权重
最后，根据图像，句子以及注意力权重得到最终的可视化描述效果
上面简单的描述了一下流程，具体的实现代码，大家可以参考源码，链接: visualization

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。