AI论文中的novelty如何评价？

最新推荐文章于 2024-01-31 07:30:33 发布

深度学习技术前沿

最新推荐文章于 2024-01-31 07:30:33 发布

阅读量539

点赞数

文章标签：人工智能机器学习 java 深度学习编程语言

原文链接：https://mp.weixin.qq.com/s?__biz=MzU2NDExMzE5Nw==&mid=2247515527&idx=2&sn=b2a3e57930f7e0c96fdfca88acff4e4d&chksm=fc4d07c5cb3a8ed36f3476ead99294d83e6327da8d93b6714cf851efc4f5fe48ac2e383cf350&scene=126&&sessionid=0

版权

本文探讨了科研论文投稿中遇到的创新性(novelty)问题，指出审稿人对创新性的主观判断和论文评价的差异。文章强调了创新性在科研中的重要性，并提供了如何量化和提升论文创新性的方法。同时，建议研究人员多读文献、培养审美能力、关注交叉领域，并从审稿意见中寻找未解决问题，以提高论文质量和创新水平。

摘要由CSDN通过智能技术生成

来源 | 知乎问答

地址 | https://www.zhihu.com/question/503131049

本文仅作学术分享，若侵权请联系后台删文处理

回答一：作者-Qs.Zhang张拳石

大家要客观看待所谓顶级会议的水平，上到nips下到aaai，不要被“顶级”这两个字忽悠了。审稿人水平我就不直说了，论文评分的方差是很大的，每个人的品味等级是不一样的。

如果你是<5篇一作的新人，尚感觉投稿比较吃力，评审有些时候有很大意义，指导你进一步提升论文。

如果你真想挑战一下，不想玩儿套路了，想做一些大胆的事儿，就很容易把自己搞到strong reject；如果你的工作再成熟扎实一些，可能会搞到strong accept和strong reject比翼齐飞。审稿中，就看一个打分weak accept审稿人，一个strong accept审稿人，在审稿讨论区怒喷两个strong reject审稿人。那俩strong reject也往回喷，互相觉得对方可笑。。。有些人往往自己不自知，也听不懂对方在说什么。

两点想法，1. 当你看不懂审稿意见的时候，觉得审稿人是xx的时候，可能是你需要进一步提升自己的思考，不是每个审稿人都是秉承着炼丹的价值观，也不是每个审稿人都有随大流的评判。
2. 当你看不懂审稿意见的时候，觉得审稿人是xx的时候，更有可能审稿人真的是xx。

客观看待“顶级”这个标签，哪儿有那么多顶级的人呢？做自己认为重要的研究，平和一些，别让论文压力去影响自己的研究方向；谦虚一点，别让中稿蒙了心。

回答二：作者-电光幻影炼金术

这是个好问题，也是我第一次被喷novelty is limited+reject之后折磨了我几个月的问题。

为什么novelty的问题这么让人难受

难受点1：novelty问题没法给我有用的梯度，让我改进工作。比如说，我哪个实验做得不好，做得不够，比较地不公平。这些都可以很快地加以解决，解决思路几乎是不言而明的。但是如果审稿人/老板喷novelty的问题，我该怎么变novel呢？这个就没那么容易了。创新其实是蛮难的。

难受点2：novelty问题往往看上去是全盘否定，做了几个月的工作，最后拿到的意见就是没有novelty，看上去就像是否定了整个项目的意义，感觉几个月甚至一年做的啥东西都不是。

难受点3: 刚开始做科研的时候，往往觉得自己创新点特别多。很多做科研的同学，本科都是佼佼者，或者都是认真学习的，自然能发现很多新问题，提出很多新解法。我作为当年做竞赛的同学，也是喜欢做新问题的。但是第一次吃了顶会的reject，是因为不够创新，看上去又确实不够创新，让我感觉我“觉得自己很会创新”的信念受到了打击。

怎么客观定量衡量novelty

novelty这个问题本身是有一定主观性的，就现在的投票决定中稿而言，想要中顶会不能有一个审稿人觉得novelty严重不足。novelty如果有问题，可能就意味着洗稿等学术不端问题，是严重的（尽管可能我们是独立地把一个工作做了一遍）。

衡量novelty，最重要的是凭审稿人的感觉。这是让科研区别于工程的一个重要不同，科研是一种文化的传播，不是像工程一样做计算和复现。啥叫做文化，维基百科定义，来源于古罗马哲学家西塞罗使用的拉丁文“cultura animi”定义，原意是“灵魂的培养”，由此衍生为生物在其发展过程中积累起跟自身生活相关的知识或经验，使其适应自然或周围的环境。一言以蔽之，novely的衡量主要靠审稿人的直觉、知识或者经验。

那么novelty是不是不可以衡量，不可以说道理的呢？也不是，毕竟交大的博士学长已经证明了，相声的笑果都可以用公式建模呢。

本文简单使用一个公式（下面称为novelty公式）：

以10分为上限的衡量系统为例，基础分是5分，5分算拒绝，6分以上算接受，越高越好。

正分加分项：

提出了完全全新的问题，真的别人没研究过，而且不是“茴香豆的茴有几种写法“这种无聊的问题。新的越本质加分越多。
提出了颠覆前人理解的新结论。比如vit。
提出了一个全新的，很好用的，很本质的概念。比如fasterrcnn里的anchor。
有全新的、重要的实验发现。比如乐透猜想。
提出了一个全新的更好的解决办法。虽然大多数论文都在搞这个，但是这个是最难加分的，因为新意很难体现。一个普遍的衡量方式是估计代码的复杂度，因为审稿人都会码代码。如果说这个东西复现就是在原有代码上加一两行，那多半不行。

负分减分项：

文章中概念都是很旧的，特别是标题里。比如标题是“一种比LSTM更好的时序建模方法”，我不否认确实LSTM现在还有提升的空间，但是LSTM本身是13年的工作（上世纪提出，13年谷歌用于机器翻译），后面提升LSTM的工作太多太多了，这个标题可以套用在很多方法上，感觉是18-19年穿越过来的，没有新意。
单纯的应用型文章。比如标题是“solving XXX via cnn"看上去就不是很好。当然如果文章做的特别好，不是简单地拿来用，也是可以的。
单纯地A+B。比如发现两个模块非常好，然后把他们放在一起水一篇新的，这样看上去就很容易被怼。
实验效果跟之前的没啥差别，比如涨了0.1%。那就是说跟之前的没本质区别。

衡量novelty的常见主观错误：

1、resnet不也是加了几行，我也加了几行，simple yet effective嘻嘻。

resnet的新意在第三点，提出了新的本质概念：短路，而且通用有效。不代表加几行代码的一定就可以算novel。事实上大部分novel的发现都需要很多代码。

2、审稿人不是这个领域的，品味不出我的novelty，是他的问题。

目前审稿人很可能来自于不同领域，最好是能用通俗易懂的方法让不同领域的人明白。

3、我的novelty在我的方法部分，我的方法就是novelty。

方法是方法，novelty是novelty，要一针见血地指出来novelty在哪里，而不是一大段不novel的赘述，让审稿人也不知道哪一部分是已有的，哪一部分是提出来的。

4、我的不涨点，但是novel哇，应该也能中。

就大部分实验型的文章来看，不涨点的算个减分项，如果没有其他加分项，就算不novel。另外本文只讨论是否novel，现在“中稿是随机过程，好文章不一定被接受，但坏文章总是被拒绝”（李飞飞原话）。

5、我的idea又跟别人撞车了，这个项目没有novelty，一定完了。

根据上面公式可以看出，idea只占很小的一部分，可以有很多不同的方式突出novelty。

怎么解决novelty的问题

1.多读文献加总结是科研有突破的重要途径。建议从早期的文章开始读，读的时候想象自己穿越回当时，能不能发现问题在哪里，有没有什么新的想法。然后再找后面的文章查对一下，看看自己的想法对不对。通过这种方式促使自己学会发现问题，找到创新点。

2.多阅读一些专业的审稿意见，训练自己的鉴赏能力。很多未解决的问题都能从审稿意见中发掘出来。欢迎关注我的系列视频栏目「从审稿到中稿」，带大家从审稿意见中发现问题，最终实现中稿。

3.多读读arxiv，最好培养定期翻看arxiv最新文章的习惯。很多厉害的文章都会先放在arxiv上，而做研究掌握一个好的timing至关重要，早点入局就能抢到先手。另一方面，arxiv上很多文章做的不够好，问题没做完，自己多想想努力一下就能有更好的结果。当然别忘了引用arxiv的文章并讨论区别。

4.培养自己对科研问题的格局把握，具体说，判断一个问题是三个月之内可以解决的，还是三年可以解决的，还是三十年也解决不了的。不要凭自己的主观臆断来判断，多看看大佬怎么说。如果很多大佬都觉得一个问题三年之内可以解决，并且很有趣，那么就是一个很好的入手问题。

5.有人说，看到很多论文准确率都很高了，不知道该咋办。这是个新手非常常见的问题，我想引用一个著名的比喻来回答。一个问题的模型，就好比一架很复杂的波音飞机，有几百上千个按钮，有的重要，有的不重要。你现在看到的，就好比看到有那么一架飞机飞的很快。但是更有意义的问题是，你对这架飞机的性能完全了解吗？哪些部分是真正起作用的？能不能造一架更简单但是飞的更快的飞机？如果不能，瓶颈在哪里？这架飞机是不是足够鲁棒，在任何条件下都能飞得很好？

6.有人说准确率已经很高了，比如说达到了95%。一个事实：如果把5%的错误样本拿出来构成一个数据集，那么它的正确率将是0%。

所以关键不在准确率多高，而在失败的样本是不是重要。在真实的自动驾驶或者机器人中，有1%的失误可能会导致很快报废。

7.永远关注交叉领域或者新领域，并大胆提出新想法。可能新想法会被另一个领域的人爆锤，不要灰心，这是常态，并不要怕碰壁成为作为阻止你学习的理由。不要自己给自己设置壁垒。

8.可能导师会觉得研究另一个领域会投入很多资源（比如算力或者他开会的时间），但是他挡不住你学习另一个领域的论文。资源可以受限，但是思想不会受限。特别是一个领域的突破性进展，往往可以影响其他领域。

9.把卡住自己的问题记录下来，之后会有意想不到的影响。我跟swin transformer(今年获得了比best paper很难得的马尔奖)的作者聊过，他们是怎么想到swin transformer的？他们说，之前就有想过把self attention替换cnn，但是瓶颈是计算量会大很多，看到谷歌出了vit，算的很快，解决了他们之前的瓶颈，就是self-attention也可以很快还很好，这样他们就产生了swin的想法。

10.人的创造力是无穷的，科研更多是一种文化，比赛才要刷点。比如同一届的会议有很多论文在imagenet上点数都差不多，但是都各有亮点。百花齐放，百家争鸣，而不要内卷。

11.多复现一些代码，很多论文都是表面好看，实质代码一跑就有很多问题。

12.历史是会循环的，旧的领域的突破往往可以适用于新的领域。因此多看看经典论文很有帮助。

13.要掌握一门到两门可以泛化的，经过大量事实验证有效的方法论。举个例子，比如加速计算的cuda编程等一系列方法，在不同的领域都可以试用。

14、很多好的idea都是在讨论和碰撞中产生的。尽量多和研究者讨论，方式不限于

（1）实验室交流

（2）参加讨论会或者研讨会

（3）微信群组讨论，可以看评论区加入我的讨论群

（4）参加一些国际顶级学术会议，不需要发表论文也可以参加

（5）网上看workshop的录像

15、没有比较就没有伤害，把同一个顶会做同一个任务的论文放到一起，高下立判。

16、想到什么好的idea，马上去试，不要犹豫。没有不好的idea，只有不明确的idea。

17、如果单个数据集不能做好，尝试做更多数据集，甚至是跨领域数据集。小数据集上有用的，不一定大数据集有用。

欢迎大家加入DLer-AI顶会交流群！

大家好，这是DLer-AI顶会交流群！首先非常感谢大家的支持和鼓励，欢迎各位加入DLer-AI顶会交流群！本群旨在学习交流人工智能顶会（CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等）、顶刊（IJCV/TPAMI/TIP等）写作与投稿事宜。包括第一时间发布论文信息和公开演讲视频，以及各大会议的workshop等等。希望能给大家提供一个更精准的研讨交流平台！！！

进群请备注：顶会+学校/公司+昵称（如AAAI+上交+小明）