进行在图像领域的研究工作已经有将近一年时间了,在这一年时间里面,从传统图像到深度图像、从图像到视频、从目标检测和识别到姿态估计与行为检测,都有所涉及,也发表了一篇中文核心(CSCD&EI)。我的研究工作主要在于工程领域:将当前一些较好的算法应用到工程实践当中,并不涉及太多算法的改进工作,研究的最终目的也是完成图像相关领域的系统架构。
在这将近一年时间里,我粗略阅读的论文有上百篇,精读的也有几十篇。从一个什么都不懂的状态,到各个领域都有所认识,其实是一个非常艰难的过程;从没有阅读过专业论文到现在看论文也算游刃有余,也是很艰辛的一段历程。一直都想写写自己在工程上灌水的一些经验,在现在忙着写毕业论文的空隙,也简单的谈一谈自己的想法。
在读论文之前,还是得先明确自己的身份,是学硕还是专硕,毕业的时候自己的毕业论文应当达到一个什么程度。就专硕而言,如果导师没有太多要求,一般是不要在算法上做出太多创新的,那么读论文时,就可以略微功利一些,不用每一篇文章都去深究其背后的原理,而是以找方法的形式,去探索当下这篇文章中涉及到的算法,我可不可以实现,能不能适用于我所想达到的工程系统之中,这篇文章可以给我带来怎样的灵感。更具体地说:如果我想完成一个昏暗地带的图像增强的功能,那么我读论文就应当以论文中提到的方法为主,是a方法,还是b方法,它当前是否成熟可用,而不需要过分探究这个算法背后涉及到的数学原理;当阅读了大量的文章之后,自己就会对将要进行的工程项目有一个大概的认识,有哪些方法是在我将要做的事情中用到的;最后一步就是将自己所收集的这些方法,一一实验,选择一个更加简单而高效的方法;当确定需要用到该方式去完成自己的论文时,再去仔细阅读几篇关于该方法的核心文章,比如该方法的初创论文、后续在方法上做出了卓越贡献的文章。(这里就又涉及到了如何去搜索文章的事情了,以后再提)
在初次进入到图像领域中时,首先应当明确图像领域中有哪些子方向,每个子方向可以做一些什么,这个时候就应当去阅读一些综述类文章,无论文章质量如何,都可以阅读,因为综述文章的主要内涵就是告诉我们曾经图像领域中到底放生过什么,谁在图像的哪些子领域上研究出了什么内容;若发现自己对姿态估计这一领域的内容感兴趣,则再去寻找姿态估计相关的综述类文章,可以直接在知网上搜索“姿态估计综述”。
另外就是一些子领域可能有重合的研究内容,比如行为识别(action recognition),其实它下属的子领域就有三四个,比如:静态图片的行为分类、行为视频的分类、未裁剪视频段行为定位、基于姿态估计的实时行为检测等等。其中,姿态估计和行为识别原本可以算是两个子领域的事情,但是又有通过姿态估计(骨架)去做实时的行为检测的研究,这种子领域交叉的研究内容就需要多阅读相关文章、博客等去逐渐明确。
在阅读文章时,文章最后的参考文献也非常重要,如果已经确定了当前文章是对自己研究非常重要的文章,那么在背后支撑这篇文章的参考文献也应当纳入自己的阅读范围内。
——记录于2019.11.26