理工科如何做research和survey

版权声明:如果对您有所启发,欢迎留言告知。若需转载请先联系作者获得许可,转载后请注明出处。 https://blog.csdn.net/yq_forever/article/details/78915687

最近实验室项目有些多,小boss给了很多survey的任务,还要加入到一个项目里面去。理工科的孩子做research真心苦逼啊。

硕士生的三大法宝:English, Mathmetics,Programming.

在网上看了两个关于此方面的文章,感觉挺不错的,转载到这里。

首先是台大资管系主任庄裕泽教授关于survey写给同学们的信件。


Dear all:

今年的proposal我用较高的标准来衡量,因此大部份的人都得再花一点时间修正。我的用意是与其等到四、五月你们写论文时再要求你们改进,不如利用这个寒假好好督促你们把论文的前三章写得完整。我大致翻了所内今年提出的proposals,我们实验室的成员大部份只在平均附近(或者低些)。我想如果再不严格督促你们,我们以后恐怕无法再以LAB成员自豪。

我大概跟你们提过如何写proposal,但可能不是很有系统。为了让你们能把proposal及论文写好。我花了一点时间整理自己的心得,供你们参考。

论文大致上有五、六章。第一章是Introduction,这一章通常只佔论文整体篇幅的十分之一,却是最关键的一章;它就像一个物品的包装一样,即使结果再好,但包装差,也会让整篇论文顿时失色。在国际会议论文的审稿过程中,很多委员往往仅从Introduction中评断论文是否值得接受。Introduction要如何写好是需要一些天份与努力的,基本上它就像在写作文一样,要有强而有力的开头,在前一、二段就能带领读者进入你要研究的领域。接下来的几个段落,你必须替读者建立足够的background,让他们了解你论文的研究背景。Background建立好之后,你必须点出整个研究的动机,这是最关键的地方,动机不足,无法显示你研究的重要性,变成无病呻吟,甚至连呻吟的声音都听不到,不晓得你到底要做什么。动机点出来之后,通常就会说明你的研究成果及主要贡献,也就是论文的价值之所在。在Proposal阶段,这部分会以预期的方式来呈现。最后,你会花一段文字来说明整个论文的架构,并做为第一章的总结。

除了动机要强之外,第一章一般比较容易犯的毛病是研究背景给的不充分,以及与研究动机没有连贯性,研究背景漫无边际的讨论,然后“天外飞来”你的研究动机。切记一点,写研究论文逻辑一定要清晰,整个章节的构思逻辑是什么、为何这个句子要承接上个段句子、这个段落要承接上个段落等等,一定要清楚的思考过。许多论文的败笔在于论文东一段、西一段,段落之间没有逻辑关联,让论文整体杂乱无章。如何避免这样的问题,如果你没有天份的话,只好靠后天的努力:对于论文返覆的读取,不厌其烦的思考句子、段落之间是否有逻辑上的问题。我个人的经验是,我自己写过的文章,每读一次都有新的体会与修正。一篇论文写完之后,我都会再从头到尾读一次,修改到我最近一次读过后没有新的修正为止。这样通常会经历四、五回合以上。我最不喜欢见到的是学生论文写完之后,从头到尾连一次都没看过就送给我,里面错误百出,甚至连基本的连结 (cross reference)都错,好像要我帮他校稿一样。你们有些人也有这样的毛病,这样的毛病不改是做不好学问的。以后我看到这样的论文马上就退。我以前念书的时候跟指导教授meeting讨论论文时总是战战兢兢,在给他看我的论文时我自己会来回看好多次,深怕犯一些明显的文法或逻辑错误,或他曾经指正过我的错误,我也藉此训练出比较独立的研究能力。这里我感觉大多数的学生都比较缺乏独立的研究能力,有些则完全依赖指导教授替他修改论文,甚至觉得理所当然,这是相当不正确的研究态度。

第二章是文献探讨。在写这章前一定要仔细思考你要探讨哪些相关文献,这些相关文献如何分门别类,然后在第二张开头以约一页的篇幅描述你要survey的内容、范围与架构。当然,你得提供充分的理由说明为何你要做这样的组织分类。文献探讨要做的好是一门学问,它并不是把一些相关的文献看过,然后对每个文献作摘要即可。把相关文献做一个有系统的分类,本身就是一种贡献。一般而言,每个研究领域都可以拉的很广,你在有限的空间内不可能全部涉猎,因此,你得设定一适当的焦距,决定文献探讨的领域范围。

在你设定的范围内一定有许多文献要探讨,你得将这些文献分门别类,每一类别选定一个最具代表性的文献做这个类别的开端。接下来你得摘要这篇文献的主要内容与贡献,并且用比较简单浅显的方式让读者了解关键的技术。一般而言,这篇代表性的文献后续多少有些follow-up继续改进前人的结果。这时你大致不需要针对每个follow-up做仔细讨论,只要用一、二句话摘要出每个follow-up改进之处即可。把比较重要的follow-up说明之后,你应该以一段话做为这个类别的结论。这一段话必须评论目前在这类别的研究成果大致如何,还有那些不足的地方,以及与你的研究有何关联(如你会采用那些既有的技术,你的研究方法或成果与它们有何差异,你的研究对这个领域的贡献是什么)。

很多人的文献探讨只摘要了别人的成果,却少了最后这一段,无法让人了解你的survey与你的研究议题有何关联,也不晓得你对前人的成果看法为何。另外一个比较常见的问题就是survey不深入犀利,讲得都是很表面得东西,让人家觉得看你的survey对这领域一点帮助都没有。

对每个类别survey完之后你必须对这整个章节做一个结论。在这个总结里,你必须汇整出这个领域里目前的研究进展,还有那些不足的地方,并且从此支持你在第一章提到的研究动机,以承接下一章节。

第三章基本上是要描述你的研究议题与方法。你必须清楚的描述及定义你的问题。有些时候,问题与定义会牵涉到你的系统或演算法所植基于的model,因此你也必须定义你用的系统model是什么,有那些假设的前题。接下来就是说明你的研究方法,所须的定义与所用的核心技术。接下来就是提出你对问题的解决方桉,并分析讨论它的优劣。在proposal的阶段基本上不必具体的提出解决方法,只要讨论你大致将采用的措施即可。但即使如此,在proposal的阶段这一章也不能马虎的做表面的探讨。一定要具一定的深度,才可以让committee 的成员相信你对于你的研究议题有足够的了解。这一章写深入,你未来修改甚至更换研究题目的机率就低。

第四章通常是对于你在第三章提出的问题解决方桉做一实证,如系统模拟,比较你的方法效能为何、与既有的方法有何差异。

第五章就是对论文做一结论,在这里你必须重覆你整个研究的动机,再叙述你的成果,然后说明你的研究价值与贡献。每项研究总有不尽完美之处,你的大概也不例外。因此,接下来你就要讨论你的研究成果或系统还有那些可以改进之处,据此引出未来研究方向。

第四、五章在proposal阶段是不必要有的。另外,根据研究议题的差异与研究成果的大小,有些论文(特别是博士论文)在讨论其研究成果时会分成两个以上的章节来说明,因此论文总体而言会有五章以上。

论文最后必须附上参考文献。这是大多数人最容易忽略的地方。因此,研究态度严不严谨也很容易从这个地方看出。我已经告诉过你们参考文献要如何编排,应该会有那些栏位。你们要确实且详尽的去建立每笔参考文献。另外,参考文献的数目应该要适中。硕士论文我认为应该在30笔到40笔之间。博士论文可能多达四、五十笔以上。但也不要过度夸大,把许多不相干的都放进来。当然,这些数目都不是绝对的,它会随研究领域和议题有所差异。

我再花点时间跟大家谈谈怎样做好survey的工作。(我用了约一天的时间整理这些东西,我的中打不好,昨晚打字打到清晨4点,只打了2/3,所以请你好好的看完!)

Survey是做好论文的第一步,也是关键的一步。Survey的目的大家都知道,就是要对研究的议题有个深入且广泛的了解,这样才知道目前在这领域里研究的进展已经到什么地步,state of the art是什么,有那些的子题及技术已经被探讨,从而也可以知道那些还可以开发,那些技术可以被你的研究议题拿来应用。Survey 做的不好,最致命的打击就是在你对你的研究议题一头埋入,花了许多心血,好不容易熬出一些成果之后,突然才发现别人早已经发表同样或类似的成果。

怎样才能把survey做的深入且广泛呢?我的方法是你要知道在这领域里主要的国际会议是什么,然后把这些会议近几年来(至少三年)所发表过的论文的title及abstract浏览一次,找出跟研究议题比较相关的论文(注意:是「议题」,不是「领域」)。这样初步找出来的论文大概从十来篇到二、三十篇,甚至也可能更多。接着,你得把这些论文的Introduction看一遍,对它们做个初步的浏览,然后把这些论文依它们与你的研究议题的相关性做个大致的排序。接下来就是依序把这些论文仔细的研读,每篇论文的重点是什么,关键的技术又是什么,都得弄得很清楚。我的经验是:因为刚开始对研究议题较不熟悉,前面几篇念起来通常较吃力。可是随着研读的论文愈多,你就会发现愈来愈轻松。

在这个阶段,你每篇研读的论文大概都是够水准的论文(因为他们是发表在主要的国际会议)。在研读这些论文的时候,你得看它们探讨那些相关的文献,这些文献你大致都得知道,并且就其中与你研究议题最相关的论文,你也得找出来仔细的研读,并且重覆这样子的工作一直追溯下去。你不用担心这样做会无止无境,因为当你从最近的一篇论文开始往前追朔,大概不超过三、四代,你就会发现不必再追朔,因为再往前追朔,你会发现它们要么与你的研究议题愈来愈远,要么就是你研究领域的基本知识。如果是你研究领域应具备的基本知识,而你还不了解,那你应该回头再修一些课把基础打好,不该这么早就进入你想研究的议题上。

根据这个经验法则,你会发现你在survey的阶段只要把握一个原则:把与研究议题相关的最近几篇论文拿出来,看看这些论文所引用的文献有没有你不知道的,如果没有,那么比这些论文早的文献你大概都没遗漏了。如果有,就把它们找出来仔细的研读。随着你研读的论文愈多,你的功力就愈增加。当你发现拿到一篇新论文时只要看完它的Introduction之后,你就知道这篇论文的重点及猜出它用的主要技术之后,你的功力已经提升到可以进入研究议题的阶段了。在这个阶段,如果论文的研读够深入及广泛,你往往也可以发现新的研究议题。

你的survey还不能在这里停止,因为你的触角可能尚未含盖所有关于研究议题的文献。你目前只有survey与研究议题相关的主要国际会议(以及会议论文所引用到的相关文献),这些会议通常不超三到五个。目前的国际会议相当多,而且有些会议的研讨议题又广,因此有可能两个会议的主轴不一样,但却含盖类似的子题。举例来说,假设你要研究的是peer-to-peer系统上的资讯搜寻,你大概会找专门探讨peer-to-peer系统的国际会议。这个目前大概有二、三个。可是你知道那里还有呢?我告诉你至少还有二、三十个可能:专门讨论分散式系统里的国际会议(这至少有五到十个,其中first tier的约三、四个,其余为second tier),讨论平行运算的国际会议(这至少也有五个),讨论网路与通讯系统的国际会议(这至少十个以上),讨论资料库与资讯检索的国际会议(这至少也有五个),相信了吧!而且还有好多新的workshop你从未听过的。

你一定会问:一、我怎么知道有那些可能相关的国际会议;二、我怎么有办法消化完这些会议的论文?

第一个问题得从你第一阶段的论文研读着手。在研读这些论文的时候,你得注意它们发表在那里,从而知道有那些可能相关的国际会议。

第二个问题:如何消化与你的研究议题可能相关的国际会议内的论文?你把与研究议题相关的最近几篇论文找出来,看它们是在那一年发表的。如果你研究的是热门议题,你找到的应该是去年或今年的论文;如果你的议题冷门,那最近一篇论文有可能是好几年前的事。不过不管是冷是热,你都只需把相关的国际会议最近一、二年的会议议程拿来看看,有没有与你的研究议题相关的论文发表,有的话把论文找出来仔细研读一下这篇论文有什么突破,另外,也注意一下这篇论文引用的参考文献有没有你尚未读过的,没有的话表示你前阶段的survey做的很仔细,有的话你就得把这些遗漏的论文找出来研读,并且用前面提到的方法再去追朔这篇论文三、四代以内的参考文献,以及论文出处,找出是否还有其他的相关国际会议,并且一样得把这些会议近一、二年的议程拿来看看是否有相关的论文发表。这些过程一定会收敛的,而当你发现没有新的论文被你找出来之后,你的survey工作大概已经做的差不多了,可以准备收工全心投入研究议题上。通常而言,你在第二阶段找到的论文不会太多,大多数的论文在survey的第一阶段都会看到。收工之前,为防万一,你再到Google、Siteseer及几个主要的digital library,如IEEE,ACM,Springer等去search一下,确定没有漏网之鱼。如果你survey的深入,你应当知道要下那些关键字去查询。这个步骤也可以确保如果你研究的是冷门议题,在你看到的最近一篇的论文,到近一、二年的国际会议这期间,有没有其他的论文你没有注意到的(因为你最后一阶段的survey工作只注意相关会议最近一、二年的议程,而你看到最近的论文可能是好几年前的东西)。

在这里我好像都没提到期刊论文。一般而言,期刊论文通常比较完整,但刊登的结果往往是二、三年前的东西。就资讯科技而言,二、三年内的研究进展可能很大,因此比较新的结果通常先发表在国际会议上,发表之后,经过几回合的修正才会投稿到期刊。所以你survey的论文比较新的东西很少会在期刊上发现。但反之,比较久的成果,有可能已整理发表于期刊上。如果是如此,那你在研读这个成果时,最好是找已发表于期刊上的论文研读,这样会得到比较完整清楚的资讯。

整个survey的阶段会看完几篇论文?这当然看你的研究议题而定。但三十篇以上是跑不掉的。如果加上你只浏Introduction的部分,那可能在五、六十篇以上。
最后,我要你们做一件事情:

在一星期之内,把survey的工作按照我上面讲的步骤重做一次。星期六之前,请你整理一个清单摘录下列资讯,并email给我 (记住:做完整之后再email给我;我不要片段片段的接收你们的资讯):

  1. 与你研究议题相关的国际会议及期刊有哪些。
  2. 你找到哪些论文,论文格式请整理成bib档格式(记住:我要的是bib档格式,且要非常完整正确。如何做到,可以问实验室学长。我也会请他整理一份心得告诉大家。)
  3. 在你找到的论文里,请用另一份表格整理下列资讯:请就这些论文依其与你研究议题的相关性分成三类:密切相关、相关、略为相关。同时请标记哪些是你已经仔细的研读过的,哪些是你只浏览Introduction ,但有把握住整篇论文的重点。若有尚未看完的论文,也请标记。
  4. 请把你列出来的所有论文电子档以下列方式命名:

年代-会议或期刊缩写(若不知,请以第一作者的Last Name代之)-Title的摘要。
例如:2003-SIGCOMM-Peer-to-Peer Information Retrieval Using Self-Organizing Semanticverlay Networks.pdf

然后请你上传这些档桉到ftp,你的个人目录底下的paper 子目录内。我会就你整理的清单去判断你的survey是否足够,再来决定你的proposal及论文应该还要做哪些工作。

Joung

转自:http://blog.sciencenet.cn/blog-498570-639703.html


然后是一篇关于如何做research的文章。

如何找题目:
1,首先很广泛的的看领域内的top conference的paper,或者看看这个领域的大牛写的survey paper。
这一步可以称为“survey”阶段。这里你需要了解各个领域大概是在做什么样的问题。这个阶段只需要看paper的abstract,introduction,related work和conclusion。看完每篇paper后主要要弄清楚四个问题:
(1)What is the topic?这个paper研究了一个什么样的研究课题
(2)Why this topic?这个课题为什么有意义
(3)What is the challenge?这个课题有什么难点,challenge
(4)What is the key idea?这篇paper是从什么思路来解决这些challenge的,它与已有的工作相比有什么好的地方。

2,具体深入到一个自己比较感兴趣的具体的细分领域,了解这个领域近几年的工作。
这一步是对具体的细分领域的更细致的survey。
这个阶段有点像在画一个表格。每个具体的细分领域中的问题都可以包含几个不同的维度。大多数paper都是着重解决其中的一个或者几个维度的,而对其他的维度不作考虑,或者放松了假设的条件。
假设有这样一个大表格,y轴是所有的paper,x轴是所有可能的看问题的维度。看paper的时候,把每篇paper解决的维度勾上。我们甚至可以加上z轴,表示这个paper在这个维度上解决的效果,例如算法的效率,额外的开销之类。通过画表的方法,我们可以知道这个细分领域中,有哪些维度的组合的问题还没有被人解决过,以及解决的程度如何。
这个阶段,仍然不需要太细看paper具体的“solution”,而是更深入的理解paper所解决的“problem”本身。

3,找到具体的自己想要解决的问题。
到这一步,你算是找到你要做的具体的“topic”了。
这个topic可以是表中空缺的地方,或者是别的paper都解决得不够好的地方。

接下来就是要解决这个具体的问题了。
首先你要有一个可能的“idea”,这个idea有希望能够解决前人所不能解决的问题。它可以是从别的领域的方法借鉴来的,也可以完全是你自己的突发奇想。

(当然,如果你先有了idea,找题目的顺序可以是1–>3–>2。)

其次,你要“verify”你的这个idea,至少能用一个简单构造出来的“motivated example”来从直观上证明你的idea能比所有的方法做得更好。并且这种example是足够广泛的。也就说,大部分的情况下,你能做的更好。

这个阶段,需要理解所看的paper的解法的细节。如果你的idea来自某一篇别人的paper,你得完全看懂paper中方法的实现细节。如果你的idea是某一类的数学工具或者模型,你得了解这种数学工具如何推导和正确使用。

要注意的是,如果别的领域或者别的问题里面的方法,已经可以直接搬到你要解决的问题里面了。那么,你也不能算是在做research,只能说是在做课程project,因为你没有任何所谓的contribution。所以你需要找到你要解决的问题里面的与众不同的地方,所谓的“uniqueness”。并通过对原方法的改进,解决好这个uniqueness带来的新问题。

3中的每一步一旦不顺利,你都可能需要重新回到2甚至是1。例如你可能发现你的idea实际上别人用过了,之前你survey不够细,没看到这样的paper。或者你发现你的idea根本不work,或者只是在很有限的例子中work。或者你发现你其实没法看懂所需要用到的数学工具。等等等等。

如何写paper:
1,想象你是一个推销员,你怎么介绍你的paper,从而使能够别人欣赏和认同你的工作。
2,如果让你用中文说,你会怎么组织你的paper,从而让别人明白你具体做了什么。你的逻辑会是怎样的。
3,英文的表述主要学习借鉴自己之前看到过的native speaker写的你觉得写得很好的paper。

1,2其实是最重要的,实际上就是逻辑是最重要的。不管是中文还是英文,你的论文组织都需要有条理。你首先得讲清楚你为什么要做这个研究。比别人的好在哪里。为什么要让你的paper中。你得讲清楚你研究的是个什么问题。每一个section或者段落,你得有中心句让人一眼就看出来你要说什么。

如果你用中文口语,能够清楚的推销你的paper,你就能用英语把paper写得明白易读。

几个注意的点:
1,从问题本身出发而不是通过工具套问题。
我老板倾向于这个思路,当然也很多很好的别的学校的研究小组,他们的风格就是拿到一个好用的数学工具或者思路,然后尽可能的套到很多问题上面。
2,做任何具体topic前都要问的问题:你的问题和已有paper中解决过的问题有什么不一样。
3,在model问题的时候,如果解法需要加/减某个assumption,一定要问自己为什么可以这么假设。
4,不要过度纠结于解法,要问自己为什么一定需要用某种方法来求解。
5,看别人paper的时候,一定要critical thinking。只要写过paper就知道自己写的时候都会有很多的局限,所以别人的paper也不会是十全十美的。要做一个thinker而不是learner。批判要大于接收。抓住paper解决的问题本身,而不要被漂亮的解法亮瞎。从更大的背景上去将paper“庸俗化”而发现其中真正高明或者烂俗的地方。

最后总结一下我个人认为的好的research的几个特征。
大致按时间顺序排列是:
1,interesting problem;2,reasonable formulation;3,beautiful solution;4,surprising results(最好是有别于常人的直观或极大推进现有的局限);5,excellent presentation。按照重要性,排序大概是1>2>4>3>5。但这几点是互相耦合的,牵一发动全身。做好的研究着实不容易。

 

转自:https://www.douban.com/group/topic/36085879/]]>

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页