谈一下自己收集资料和整理资料的经验
自己一直以来主要从事开发工作,对于资料收集和整理这方面做得工作不多,如果你觉得下面内容中表现出的技巧和方法比较拙劣望理解。
收集资料技巧
1. 下面是我资料的重要来源,与大家分享一下
1) ACM数据库,重点关注(分布式系统、分布式计算、FAST)
2) Microsoft Research与存储相关的研究
3) Storage Systems Research Center
http://www.ssrc.ucsc.edu/
4) Parallel Data Lab
http://www.pdl.cmu.edu/Publications/index.shtml
5) SNIA
http://www.snia.org/events/storage-developer2010/presentations
6) IBM Storage Systems
http://domino.research.ibm.com/comm/research.nsf/pages/r.storage.html
IBM Storage Systems被分解为如下的几个研究机构
Almaden
http://www.almaden.ibm.com/StorageSystems/
http://www.almaden.ibm.com/StorageSystems/pubs/ 可以获取很多论文
Watson
http://www.watson.ibm.com/index.shtml
Haifa Research Lab
https://www.research.ibm.com/haifa/dept/stt/sspm.html
7) Google Research
http://research.google.com/pubs/papers.html
http://research.google.com/pubs/DataandSystemManagement.html
http://research.google.com/pubs/DistributedSystemsandParallelComputing.html
8) 雅虎
http://research.yahoo.com/publication
2. 收集资料时关键词的选取方法
下面以一致性为例来进行搜索相关的资料。
1) 使用关键词的英文进行搜索(如,一致性的英文consistency)
2) 选取与该单词意思相近,相关的概念进行搜索(如,atomic, correctness, data lock, synchronization)
3) 选取相比该关键词含义更广泛或者缩小的概念进行搜索(如,一致性与强一致性)
4) 在关键词前后增加限定性修饰(如,线性一致性,Session一致性)
5) 选取你所知道的,采用了关键词所代笔技术的典型系统进行搜索(如,查看GFS、Dynamo系统中的一致性)
3. 给出我认为收集资料需要注意的方面
1) 脉络的把握。从综述开始,收集2-3篇经典的综述从而把握这个知识点在整体知识结构的位置,知识点内部的结构。
2) 全面性。资料需要全面,需要从正反两个方面进行论述(比如,一致性这个概念,就有强一致与弱一致)。需要收集多个相同或者相似的系统从而对比。(比如,分布式计算框架,就有Hadoop、Dryad)。
3) 把握重点
论文要求大家的参考文献需要有最近3年的资料所以,对于资料的实时性我就不强调了。
资料是需要按重要度进行区分,时间久的资料不一定不重要。因为很多研究点并不是突然一下就冒出来的。计算机的发展已经有了好几十年了,很多研究在很早期的时候就开始,找到该领域在不同历史时期,最经典的论文读一下十分有必要。
资料一定要看重要期刊的,看大师级人物的,要注重整体的把握,以及别人思路的把握,不要陷入到细节上。因为在具体实现某一个思路或者算法上,各个研究机构会有自己的特色、公司会有自己的需求。
整理资料方法
1. 重要文献阅读过程中要建立索引,索引的内容包括下面几点
a. 明确该文献解决问题在该领域知识体系结构中所处的位置
b. 一个创新点或者文献的一个观点,用一句话进行概括
c. 文献在问题解决时特别吸引人的思路、分析问题的方法可以摘抄
d. 时间点。可以是文献发表的时间。也可以是文件论述内容其自身发展的关键时间点。
2. 有自己的脉络
整理资料是按照自己的思路对资料进行梳理,所以首先要有自己的脉络。脉络的选择可以是按照时间、按照事物发展的轨迹、按照事物内部的组成等等来组织。具体如何选择,需要结合自己资料整理后的用途而定。
3. 在写作中使用文献
后续写作时,需要结合自己的观点,反复思考文献表达的观点。并围绕自己的论述将文献引入自己的文章中。