进入学术圈的第一年,我发了一篇三区一篇二区的文章,从什么都不懂到发论文的这个过程中,体会还是挺多的,这次就来聊聊一篇好文章的标准,对我来说意味着什么。
首先可以从分区的角度来谈,一般来说中科院二区是一个分界线,发表二区及以上的文章有助于毕业之类的,而我第一篇是三区的,第二篇是二区的,我觉得三区和二区最重要的区别就在于整个文章的论述完整性,比如说,我的二区文章是做EEG降噪的,那么整个文章,我首先需要介绍我的模型,然后对比我的模型和其他传统模型的性能,对比包括模拟数据和真实数据,最后进一步分析降噪之后ERP分析和源定位等下游任务是否有改善,大概就是这么一个论述的思路,整个文章的目标,就是要做到reviewer看了也觉得实验和分析没有明显缺漏,这样写出来的一个故事才是完整的、规范的,而对比我三区的文章,我觉得就是因为那篇文章缺少了一些分析。让人看起来不够规范,导致最终有所欠缺。
当然上面提到的更多是一个学术写作的规范,总是有人说要把论文看成一个故事去写,我也觉得挺有道理的,作为一个故事,最基本的当然就是讲的过程条理清晰,没有缺漏,如果其中有些伏笔的设置、精彩情节的描写那就更上一层楼的,但是最基本的规范性必须有所保证,我觉得这就是二区文章很重要的一个标准。
接下来,我想谈谈对我来说,一篇好文章的几个标准,或者说当我在做一个工作的时候,我在追求些什么。
第一,必须是创新,创新可以是模型算法上创新,可以是分析思路的创新,比如你把某个模型第一次应用到某个问题上,而且论述了这样做的优点,那这就是一种创新,也可以是看待问题角度的创新,总而言之,就是整篇文章,必须要有你原创的一个点,其实这也就是你的contribution。
第二,效果要好,不说第一,也起码要是第一梯队,对我来说,我每天都可以想几十个新模型,但其实不是每个都可行的,要达到效果好的更少,但是如果是作为一个完整的工作,我觉得最好模型的效果还是要处于第一梯队,不然reviewer肯定会问你,为什么你说你的方法这么巧妙最后效果却不够别人好,这时候,除非你能把你的思路的创新性、重要性和优点突出来,或者说你的工作追求的就不是效果,不然文章是很难发到好的期刊的。
第三,问题看得有多深,我始终觉得没有任何问题是简单的,在EEG相关的问题中,降噪我一开始觉得是比较简单的,因为很容易就能理解这个问题:EEG采集过程中也会采集到噪声,所以希望剔除这些信号中的噪声从而方便后续的分析,我也看到很多很多工作,他们提出了一些新的模型,或者说引用了深度学习领域一些比较新的、比较厉害的模型去处理这个问题,最后对比一下算法证明他们的效果更好,这样的工作非常多,但没有一篇可以发到一区,主要就是因为他们看待的问题仅仅停留在表面,其实在深究这个问题的过程中,我就发现,模型处理低频噪声的效果是更好的,但是对于高频噪声就比较难处理,另外,对于信号中的高频成分,怎么区分哪些是信号哪些是噪声,这是没有绝对的标准的,再进一步,神经网络在拟合的过程中,其实也是先拟合数据中的低频成分,然后再拟合高频成分,假如把这些点串起来,再进一步深挖,你就会发现这个降噪问题能够研究的点还有很多很多,研究起来也一点都不容易。所以,假如说,一个被很多人研究过的问题,你能从不同的角度去看待分析,那么你就领先了别人了。
第四,结合数学进行论述分析,一开始,我总是会听到判断一篇文章好不好,可以看这篇文章有多少公式,甚至写文章的时候也会尽可能多写公式,这种倾向一开始我也不理解,后来我慢慢觉得,公式本身作为一种数学语言,第一,他可以更好、更规范地去描述问题、描述你的模型,比如你的模型的收敛性、收敛速度,第二,可以进一步利用现有的数学工具,对问题和模型进行进一步的分析,所以如果能够用大量的数学公式做分析,就证明整个工作的逻辑性非常强,分析非常充分,另外,对我来说,我也更希望能够结合神经科学的理论、深度学习的工具和数学的理论去做工作,单纯利用深度学习分析神经科学的问题,效果是好,但可解释性差,而数学的引入就可以更规范整个分析的流程,因此学好数学,对于学术研究真的非常有必要。
以上就是我的一些看法,其实不是说一篇文章必须要非常创新、效果非常好、还有有一堆公式,只是说这是我追求的目标,因此也不要陷入一个太固化的思维去做一个工作。