噪声总是有害吗?西工大李学龙教授提出基于任务熵的数学分析框架

29ee32fb68955055a25b5a31b1f8131f.gif

©作者 | 张聪穆

来源 | 机器之心

在日常生活中,噪声无处不在,通常会给人及周围环境造成不良影响。比如,汽车产生的噪声给人们的正常工作和休息带来了不少困扰。然而,任何事物都有两面性。在一个不小心睡过了的早上,汽车噪声却会给人们释放出正向积极的信号:迟到了,该上班了。

再例如,装修房子时电钻声非常嘈杂,对周边业主造成了干扰。但仔细听,从噪声中能分辨出钻的是木头还是钢铁,也能判断出电钻运转是否正常。这些常见的现象说明了一个本质问题:噪声也可以是有用的,以往我们可能错怪噪声了。

在各式各样的科学研究的方方面面中,噪声也大量存在,如仪器精度不足导致的仪器误差、人为操作中的失误导致的偏差、极端环境等外界干扰导致的信息失真等。研究者普遍认为噪声通常会对执行的任务产生不良影响,这已成为一个约定俗成的假设。因此,围绕着 “降噪” 这一核心任务产生了大量的研究工作。然而,西北工业大学李学龙教授团队在执行信号探测和处理任务时通过实验观察验证,对这一假设产生了质疑:科学研究中的噪声真的总是有害的吗?

恰如图 1 所示,在一个图像智能分类系统中,对图像加入适量的噪声后再训练,识别准确率反而上升了。这给我们带来一点启发:图像中加入一些噪声,而不是去除,再执行图像分类任务,可能效果会更好。只要噪声对目标的影响远小于噪声对背景的影响,产生 “伤敌(背景噪声)一千,自(目标信号)损八百” 的效果就有意义,因为任务追求的是高信噪比。

从本质上来说,面对传统分类问题,在特征后随机加上适度的噪声,相当于升高了特征维度,某种意义上说,类似是给特征增加了一个核函数,实际上完成了一种低维空间到高维空间的映射,使数据更可分,从而提高了分类效果。

bb65a3e165143278a13141684759d9f1.png

▲ 图1. 图像识别准确率随图像噪声强度的增大而 “反直觉” 地呈现出 “先增后减” 的关系

更具体的任务的例子(图 2),从遥感影像中做飞机检测,一般都是把飞机紧紧框住,然后做模型训练。如果把飞机的框适当增大一些,把跑道等干扰信息加进来,模型训练效果反而会更好。为什么会出现这种现象呢?这是因为跑道等 “噪声” 和目标之间存在语义相关性,从而对完成飞机检测任务起到了正面的驱动作用,提高了检测准确率。

5a52a8f0ce0961b51ee592630286919c.png

▲ 图2. 在传统目标检测中,一般认为检测框越小越好;然而在检测飞机时,适度扩大检测框引入跑道、停机坪等背景信息能够提高检测效果。

经过对这类现象分析验证,李学龙教授的论文《Positive-incentive Noise》已在期刊 IEEE Transactions on Neural Networks and Learning Systems (TNNLS) 上在线发表。

4b9df56831926b434be7e5c2289ec81e.png

论文链接:

https://ieeexplore.ieee.org/document/10003114

0659c36142c18a4edbb92dfd510d93af.png

Xuelong Li, “Positive-Incentive Noise,” IEEE Transactions on Neural Networks and Learning Systems, DOI: 10.1109/TNNLS.2022.3224577, 2022.

文中指出,噪声在获取、数据、特征、样本、决策等诸多层面都存在,根据对完成任务是否存在正向驱动作用,可将噪声划分为 “正激励噪声”(Positive-incentive Noise, Pi/π-Noise)和 “纯噪声”。“正激励噪声” 指的是有用的噪声,能对完成任务起到正面的驱动作用。“纯噪声” 则是无用、有害的噪声,会妨碍任务的有效执行。

为挖掘和利用正激励噪声,论文给出了 “任务熵”(Task Entropy)——bf6caf40edb35d74e2fac0c2d2cd1177.jpeg的定义,并在此基础上建立了系统的理论分析框架。在任务给定的情况下,任务熵的大小衡量了噪声1e7707774ade8fb44f77a55d7f966786.jpeg与任务8aed02d2158a8c5fc5e99a4904f6ef52.jpeg之间 “互信息”(Mutual Information)的多少。在信息论中,互信息用来度量两个随机变量的 “共有信息”。

因此,论文明确指出,某些噪声和信号的产生是同源的,会附带信号特征信息,对任务完成提供帮助,这也是上述现象背后的本质原因。也就是说,当互信息大于 0 时,噪声65d8adcde3ffed9a0d2b10bcdeaab419.jpeg会正向驱动完成任务9a83a6a58e338190c37cb750c7421b5b.jpeg,即

b6d14dc1866a0991849afb4d01e92ae0.jpeg

此时,噪声3c2b493b3dd62d143b8353e707ab79f0.jpeg就是正激励噪声。当互信息等于 0 时,噪声5499e45b18f489560b631c3c9161c474.jpeg对完成任务d89978659b6736a19668b764523f7e57.jpeg没有正向驱动作用,那么此时噪声7f51f72ae0a82e90b8a566a8f1d68a4b.jpeg为纯噪声。

正激励噪声能否被有效挖掘和利用取决于任务熵的大小,也就是任务ad4cc7bb881121b8693cdecc0eb112b4.jpeg的概率分布值。在论文中列举了几种常见视觉处理任务的概率分布值的计算方式。比如,在单目标分类任务中,数据集由数据样本集合 X 和标签集合 Y 组成,数据集 (X,Y) 可以看作是从某真实分布7a5a1dd88676e5cfc80ebfc659ca6d9a.jpeg中采样而来。分布80f4fe7bc7a524d5f66e5eadba811cf5.jpeg表示 “已有数据样本(如图像)被赋予不同标签的概率”,它的任务熵衡量了 “在此数据集上单标签分类任务的不确定性或难度”。

除此之外,论文还强调了,正激励噪声的产生与执行任务的变化和噪声量的大小相关,未来将对随机共振、对抗训练、多任务学习、对比学习等多个方向产生深远影响。

正激励噪声是 “临地安防” 科研架构(图 3)中的基本科学问题之一。启发了在科研中重新审视对噪声的理解和处理的方式,同时也对信号处理、人工智能、涉水光学、稳定探测、多模态认知计算等多方面提供了理论研究支撑。

3df5307bd72ad62b8cba9ef75cf616e0.png

▲ 图3. 临地安防 (Vicinagearth Security)

作者信息

edd7d50c905edadc0ff6f636aa4c08f6.jpeg

李学龙(电子邮箱:li@nwpu.edu.cn),西北工业大学学术委员会副主任、光电与智能研究院(iOPEN)教授。主要研究方向为临地安防体系中的人才培养、科学、技术和工程问题。

更多阅读

d11034c410d364a12b6b55fe649e4cf1.png

fcb0e8cc7c9ef80034a470117096383c.png

32a93114ae4e185ed8a91b3dcf7f7997.png

79b40ad3774dccd1e7ab33313548958a.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

978243433e310824105702275205cefb.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

8d5712bb2161133a508146f6dd21fb4f.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值