目的:就是控制变量,验证本文的创新点。
消融研究的解释:消融研究通常是指删除模型或算法的某些“功能”,并查看其影响什么性能。
在论文中,一般来说会提出多个创新方法,或者新型结构模块,或注意力模块。这些东西在一起为模型的性能作出了贡献。然而为了解每个部分单独能发挥的作用,常常会在论文中提出消融研究。
例如,某论文基于baseline新增了方法A,B,C。因此,在消融的研究部分,会进行以下实验:
- baseline
- baseline+A
- baseline+B
- baseline+C
- baseline+A+B+C
等实验的各个评价指标有多少,从而得出每个部分所能发挥的作用有多大。
知乎上一个比较形象的解释是:你朋友说你今天的样子很帅,你想知道发型、上衣和裤子分别起了多大的作用,于是你换了几个发型,你朋友说还是很帅的,你又换了件上衣,你朋友说不帅了,看来这件衣服还是很重要的。