写这篇博客主要是由于心理有点小纠结,下图是微博的截图:
最近忙于写论文,需要阅读一些文献来补充下自己的论文,因为自己只是一个本科生(我知道这不是一个好的理由),对自己论文题目的领域接触时间太短了,还没能形成一个系统的认识(特别是related word最要命),无奈之下只得参考一些前人的工作。因为在写论文的过程中,我清晰的记得老师的强调:不是你的工作,一定要注明文献索引,除非是一些已知公认的成果,所以我还是很小心翼翼的,希望不要犯错,希望能做到只要引用的即给出文献参考,但是看到我找的一些文献的绪论就让我开始怀疑了,所以才有了上面图片的微博内容,真的很高兴也很感激能得到各位老师的回复和指导,当然还有其他的网友的评论。
看到大家的评论之后,我觉得大家不一定都看过这样的论文冲突,所以我开始担心——我的微博的真实度会不会受到怀疑,所以我觉得有必要做一个论文内容的对照,这里没有一点针对下面出现的论文作者的意思(只是说明这种现象,就是就事论事,更何况我个人觉得论事的目的不是想去说明或评论以前的人和事怎么样,而是希望能对后面的事情能有一点改善,对后来者能有一点经验之谈),纯粹是个人的一点抒怀,如果有人对我这个行为“不齿”的话,可以在本文或者微博评论批评。下面我将列出一些我认为一些“奇怪”的地方(论文对“计算机视觉简介”和“计算机视觉研究内容”的论述),然后后面紧接和大家分享我@的各位老师以及一些网友的评论和回复。
我先给出我文章涉及的文献(后文仅以文献序号来标注):
[1] 姜大志.计算机视觉中三维重构的研究与应用(博士学位论文). 南京:南京航空航天大学,2001.
[2] 赵颜利. 计算机视觉三维重建若干技术研究(博士学位论文). 南京:南京理工大学,2007.
[3] 王俊昌. 基于二维图像的三维重构技术的研究与开发(硕士学位论文). 武汉:华中科技大学,2009.
为了防止输入文字的疏漏和错误,我使用截屏图片来替代对论文中文本的枚举,本来想上传者三个论文供大家考证的,但是我怕会有版权问题就免了。
先看上面三论文对“计算机视觉简介”的描述:
在[1]中
在[2]中
注:上面图片的出现的文献[1]为:
在[3]中
在上面图片出现的文献[3,4,5]为:
然后再看看对“计算机视觉的研究内容”的描述:
在[1]中
在[2]中
在上面图片出现的文献[19]为:
这两部分是比较明显的,“明眼人”一看便能分晓,特别是“计算机视觉的研究内容”,我觉得以句子为单元使用最短编辑距离来求解相似度一定会很小。不是说好了的要“查重”的么,这又让我对当时的查重方法感兴趣起来了。当然使用一些技巧(如打乱次序,语意重述,在微博上看到 @Sophie-M淑 一个新的技巧“使用google把中文翻译成英文,然在把英文翻译成中文”,@马少平THU 老师也调侃回复到“新的研究课题:基于谷歌翻译的查重”)来蒙混过关的更不用说了,枚不胜举(不得不承认,有时候我自己也是这么做的)。更让我疑惑“是不是有了文献索引就可以大量引入他人的文字”(@ICT山世光 老师的回复解决我的疑惑,见下面)。
看到这里可能会为“中枪者”鸣不平:这些基础的东西本来就没什么可以写,写成一样很正常。嗯,的确, 但是我觉得硕士和博士研究本身就是特定领域的东西,之前就听一个理工院的博士老乡说过,“在自己研究的方向,其实自己就是专家,自己去探索问题”,不说是“专家”级别的, 但对一些最基础的东西还是应该具备自己的认识和理解的吧,因为硕博期间有时间去沉浸吸收。既然有自己的认识和理解,那就应该很有“料”可写的吧。那又怎么会写成惊人的一致呢,是心有灵犀,还是词穷呢?我就想起了我们想起我们从小到大读的文学作品,其中不乏叙述的同一类事情,但是我们很少会碰到有“已经被嚼过”的感觉,也就说这么作家都同一类事情都可以写出自己与众不同的感觉,所以才有了 @aixia_2012 的评论“以后读博士之前,得先修个文学专业”的侃词。再说,我觉得完成论文的任务固然很重要,难道就不要权衡一下论文属于自己的贡献的东西么——就是你写这个怎么都要尽可能“掺入”自己的东西吧,要不然还不如自己给一个文献索引直接去看别人的论述更直截了当,难道真的会为了那么点字数或页数较劲么?
切回主题,前面我就说了“论事”是希望能对“后事”有所启发,我发那条微博也就是解惑来着的。很感激各位老师对我的回复和指导解惑。下面我罗列下马老师,山老师,王老师,夏老师及一些网友的部分评论:
@马少平THU
马老师率先调侃回复到“用一神人的话说就是:我们两的方向是一样的,综述当然也一样了。”,说的我都很想知道这个“神人”的尊姓大名哈。
不过马老师马上有严肃起来了,“说正经的吧,现在都有论文查重,这样的论文一般来说最后会通不过。”最后还给出更为严厉的“批示”,“绝对不允许,三人中至少有两个人属于抄袭行为。”。
@王斌_ICTIR
王老师只有一句简短的评论:与核心保持一致。虽然没有直接回复我,但还是被我抓到了哈。
@ICT山世光
山老师的回复更是针针见血呀:肯定是有问题的,据说按照最严格的国际惯例,连续7个单词完全相同就算抄袭!另外,计算所从去年开始已经对全部硕博士论文进行查重处理!
山老师还给出了传说中的查重量化标准——连续7个单词相同就算抄袭,以及给出计算所的对查重问题的重视。不得不鼓掌呀。
@夏云庆THU
这几个老师,我只跟夏老师有过交流,先前夏老师就给我对于工作和认识的一些启示,一直都记得夏老师的好(其他老师别吃醋哈)。夏老师的回复直接就奔着“怎么写好论文”去了,很需要,很解渴呀,总结整理的4点看法很到位还夹带着幽默的对话(不知道是实际就有这样的情况,还是老师构思的,太有才了)。下面直接贴出夏老师的评论:
我的看法1: 序言introduction中,难免意思重复,越研究经典问题,越难逃此劫。我鼓励同学"用自己的语言表达", 结果一同学最后写得很口水。问原因,答曰: 学校查重后说我用了很多"别人的词 汇",我只能改用"通俗"词汇。
我的看法2: related work更没法避免重复。更改文献次序逃不过查重机法眼。我鼓励同学引用最近的优秀论文,只列举方法名称,重点阐述与论文呼应的问题。某同学最后综述只有一页。问原因, 答曰,一页分析我要解决的问题,已经很罗嗦了。
我的看法3: 查重应该重点关注intro和related work以外的内容。motivation, solution以及evaluation才是自己真正独特的东西,应该大胆写,别怕查重机。
我的看法4: 查重是个人对诚信和道德的尊重,第三方查重服务及软件是白操心。真的抄袭,查重机是不给力的。打压了写作水平较低的优秀科研成果,更会害了不少天才。the end
最后,当然非常感谢老师们的回复和指导,这篇博客纯粹是个人的一点想法。如果你看完有任何不妥还请提出批评或者指导,希望能不吝言辞,谢谢!