如何理解“高频信息/高级语义”和“低频信息/低级语义”?

如何区分高频信息和低频信息?

如果一个东西是高度离散化和语义化的,一个字的差异也可能导致词语之间的含义发生重大变化,就是高频东西。例如一句话,如果你改变了一个单词,这个句子就会变成其他的意思。还有就是经过encoder后的东西,改变一个张量,可能也会导致decoder出的东西差距很大。对于图像这种,你改变几个像素值,他代表的东西还是那样的,例如你对一个狗的图片改变了几个像素块,它还是一只狗。这有点像3D中的不变性了哈哈....

举例:

语言:语言是人类创造的,本身就是高度语义和信息密集的。

图像:它在空间上是高度冗余的,对于图片中的某个部分,模型很容易由其相邻的图像块推断出来,不需要大量的高级语义信息。你改变几个像素值,他代表的东西还是那样的。

由此可见:

图像和语言的信息密度是不一样的。对于语言本身就是高度语义和信息密集的,将句子中的少量词语抹去再让模型去预测这些被抹去的词本身就已经是比较困难的任务了;

而对于图像则相反,它在空间上是高度冗余的,对于图片中的某个部分,模型很容易由其相邻的图像块推断出来,不需要大量的高级语义信息。

因此,在 CV 中,要 mask 掉图片中的较多的部分,这样才能使任务本身具有足够的挑战性,从而使模型学到良好的潜在特征表示。【也就是说设计的任务越有挑战性,模型学习到的东西越多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Pengsen Ma

太谢谢了

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值