Learning Reasoning Mechanisms for Unbiased Question-based Counting论文笔记

最新推荐文章于 2022-05-05 18:22:02 发布

乄洛尘

最新推荐文章于 2022-05-05 18:22:02 发布

阅读量242

点赞数

分类专栏：多模态研究文章标签：深度学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38929105/article/details/118291113

版权

多模态研究专栏收录该内容

27 篇文章 22 订阅

订阅专栏

Learning Reasoning Mechanisms for Unbiased Question-based Counting论文笔记

一、引言
二、Novel out-of-distribution datasets
- 1、TallyQA-CP
- 2、TallyQA-Odd-Even
三、Spatial Counting Network
四、Result
- 1、State-of-the-art models are biased
- 2、Spatial Counting Network
总结

写在前面

照例，本篇论文出自CVPR2021 VQA Workshop的第一篇论文。目前只有官网谷歌可以下载~
链接：Learning Reasoning Mechanisms for Unbiased Question-based Counting
文章不长，只有三页五个部分。But References就占了一页~~

一、引言

在这里插入图片描述
首先指出biases的好处，然后阐述其缺点：在real word有害。所以作者提出需要建立这样数据集，并且以计数问题举例，之后列举了TallyQa数据集中存在的bias。

最后介绍一下自己设计的两者计数数据集：
1、设计理念类似VQA-CP；
2、引入SCN，评估性能。

初判断应该和上篇：Point and Ask: Incorporating Pointing Into Visual Question Answering论文笔记的写作手法差不多，描述数据集+模型+人类评估

二、Novel out-of-distribution datasets

1、TallyQA-CP

在这里插入图片描述
简言之：Tally-QA数据集训练集和测试集是用来评估模型依赖问题的情况。
注意：这个图是下一个数据集的示例。

2、TallyQA-Odd-Even

简言之：TallyQA-Odd-Even主要用来评估模型依赖问题+图像的情况。
与TallyQA主要区别：训练集大部分为偶数，测试集大部分为奇数。
在这里插入图片描述
确实佩服这个想法了，究极变态，需要模型做出咋样的努力啊？🐮

三、Spatial Counting Network

在这里插入图片描述
按照惯例：介绍一下模型组成，也就是上面这张图了。

令我想不到的是，这么短的文章竟然介绍了Loss，看一下有何神奇之处：
Loss:

果然，是有原因滴：引入了新的损失函数：L_H

效果确实可以啊！👍

四、Result

1、State-of-the-art models are biased

确实，“不吹不黑”，标题牛皮。
在这里插入图片描述

2、Spatial Counting Network

在这里插入图片描述

这一部分分析模型在测试集上标签的分布情况。注意一下，前文提到的训练集大多为偶数，测试集大多为奇数，所以这里出现了一些偶数。有意思的是，SCN在偶数计数精度高，奇数计数精度低。

总结

Over, 完结撒花。
总结下这篇文章：主要是引入了Tally-QA-odd & even数据集，以评估模型biases问题，采用SCN模型实测数据集，发现有效果。

总结起来就这么多，也没啥特殊之处的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Learning Reasoning Mechanisms for Unbiased Question-based Counting论文笔记

Learning Reasoning Mechanisms for Unbiased Question-based Counting论文笔记一、引言二、Novel out-of-distribution datasets1、TallyQA-CP2、TallyQA-Odd-Even三、Spatial Counting Network四、Result1、State-of-the-art models are biased2、Spatial Counting Network总结写在前面照例，本篇论文出自CVP
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

乄洛尘 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。