从误差分解看Few-shot的核心问题

Paul-LangJun

于 2024-04-10 17:49:40 发布

阅读量222

点赞数 2

分类专栏：神经网络文章标签：深度学习 Few-shot

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/137604595

版权

神经网络专栏收录该内容

45 篇文章 9 订阅

订阅专栏

FSL训练过程一般都是最小化经验误差ERM。

同时，由于现实任务的实际数据分布 $P(x,y)$ 是未知的，因此无法找到一个最优的参数组合 $\hat{h}$ ，能最小化期望损失（最小值多少也是未知的），我们能做的实际上是尽可能的去找一个参数组合 $h^*$ 逼近 $\hat{h}$ 。

所以，必须设定一个假设空间 $H$ （对应一个具体的模型，比如Vit，不同模型的假设空间不同），在这个假设空间里去寻找一个参数组合 $h^*$ ，它的期望损失能够逼近 $\hat{h}$ ，当然，这个假设空间下的数据分布我们也是未知的，所以，我们做的只能是在这个假设空间下，使ERM损失 $h_i$ 逼近 $h^*$ 。

根据误差分解的定义，总的误差可以分解为：

可以看到，总误差受假设空间（模型）和训练集影响。因此，可以从模型、数据以及算法三个方面着手优化FSL。

但是，FSL中的训练集一般很少。在有大量监督信息的情况下，第二项误差几乎可以忽略，但是FSL中这项误差是不可以忽略的，根源还是数据量太小，两种数据规模下误差的逼近情况如下图所示。

可以看到，数据量充足情况下，误差逼近的会很好，但是在FSL这种情况下，误差逼近的就差强人意。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
从误差分解看Few-shot的核心问题

在有大量监督信息的情况下，第二项误差几乎可以忽略，但是FSL中这项误差是不可以忽略的，根源还是数据量太小，两种数据规模下误差的逼近情况如下图所示。可以看到，数据量充足情况下，误差逼近的会很好，但是在FSL这种情况下，误差逼近的就差强人意。，当然，这个假设空间下的数据分布我们也是未知的，所以，我们做的只能是在这个假设空间下，使ERM损失。（对应一个具体的模型，比如Vit，不同模型的假设空间不同），在这个假设空间里去寻找一个参数组合。是未知的，因此无法找到一个最优的参数组合。，它的期望损失能够逼近。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。