科研论文检索方法入门(计算机领域)

科研论文检索方法入门(计算机领域)

一、写在前面

什么是科研?Research!科学研究是一个包括调查、收集、整理信息,解释信息、提出疑问、找出不足,思考、进行创新,实验验证、形成论文的整体且系统的过程,所以科研的第一步就是search and re-search。

二、CCF推荐期刊的使用方法

1、简介:《中国计算机学会推荐国际学术会议和期刊目录》,(online:https://www.ccf.org.cn/Academic_Evaluation/By_category/)是由中国计算机协会(CCF)提出的一个计算机界研究者们发表研究成果的推荐列表,其中推荐期刊和会议包含A、B、C三个等级,与JCR分区无关。

2、以其中的“网络与信息安全”领域为例,推荐学术刊物中,TDSC、TIFS和Journal of Cryptology为三个A类期刊,后面给出了此期刊在dblp上的网址。再看学术会议,其中CCS、S&P、USENIX Security和NDSS称为“四大安全会议”,EUROCRYPT(欧密)、CRYPTO(美密)和ASIACRYPT(亚密)称为“三大密码学会议”。

一般来说,老师建议认真阅读的论文是A类期刊论文和A、B类会议论文,而且一般会议论文相对来说实时性更好,基本是今年投稿的论文今年就会发表,而期刊就不一样了实时性很差,有时候一篇论文要3年才可以检索到。

做人工智能、计算机视觉和机器学习方向的一般关注“人工智能”这个领域。

三、dblp的使用

既然CCF推荐中给的网址也是dblp的,那我们首先介绍dblp。

1、简介:DBLP是一个计算机科学文献目录网站(https://dblp.org/)。

2、检索。最简单的就是在搜索框输入论文名字进行检索。
检索界面

我们发现在搜索框的左边可以选择检索的内容,包含作者搜索、venue(地点)搜索、发表物搜索、混合搜索,默认是混合搜索,(但是这个发表物搜索和我想象的不一样,自己可以试一下)。
检索规则

我们再来看搜索语句的搜素,这类的搜索引擎一般支持的检索语句规则都比较简单,a. 关键词都是不区分大小写的,且是前缀匹配;b.使用$(美元)符号取消前缀匹配,变成精确匹配;c. 使用空格表示逻辑与;d.使用管道符号 | 表示逻辑或。

注意:当给定多个关键词(以空格分隔)时,只有所有的词都满足时才会匹配,所以不确定的词只放确定前缀即可。

3、期刊或者论文目录。以CCS为例,可以通过CCF推荐会议/期刊网站进入,或者在dblp直接搜索进入,https://dblp.uni-trier.de/db/conf/ccs/index.html。最上面时“workshop”,一个会议的workshop中的论文并不属于主会论文,往下翻我们可以看到列出了每年的的时间地点,可以点击“contents”或点击左边的“view”进入某一年的目录。

以2020年为例,会分为很多session,每个session对应有一个主题。我们可以找到自己感兴趣的论文,点击右侧的view - electronic edition via DOI,到这篇论文的出版方查看论文的详细信息。注意,dblp只是一个文献目录网站,这里提到的DOI(Digital Object Identifier)是由国际标准化组织(ISO)标准化的用于唯一标识对象的持久标识符或者句柄,不仅仅论文有,其他的发表物或者其他的东西也有这个DOI,反正通过这个DOI可以找到对应的论文。由于CCS是ACM的会议,所以会重定向到ACM网站的此会议的此篇论文。因为CCS原本就是由ACM出版,所以我们也可以从ACM网站看到CCS’20的论文目录,https://dl.acm.org/doi/proceedings/10.1145/3320269

4、浏览器插件“CCFrank”,在 dblp 和 Google 学术的搜索结果中显示中国计算机学会(CCF)推荐的国际会议和期刊排名,因为CCF推荐的期刊或会议很多,有时候找到论文不确定是不是值得看,挨个在CCF推荐里找很慢,所以可以使用这个插件。

四、多种检索工具的介绍与推荐

1、dblp。见上节。

2、Web of Science。百度百科中写道,ISI Web of Science 是全球最大、覆盖学科最多的综合性学术信息资源,收录了自然科学、工程技术、生物医学等各个研究领域最具影响力的超过8700多种核心学术期刊。利用Web of Science 丰富而强大的检索功能–普通检索、被引文献检索、化学结构检索,您可以方便快速地找到有价值的科研信息,既可以越查越旧,也可以越查越新,全面了解有关某一学科、某一课题的研究信息。

1997年,Thomson公司将SCI (Science Citation Index, 创立于1963年), SSCI (Social Science Citation Index,创立于1973年) 以及AHCI (Arts & Humanities Citaion Index,创立于1978年)整合,利用互联网开放环境,创建了网络版的多学科文献数据库——Web of Science,成立至今已经20年。2016年7月,Onex Corporate与Baring Private Equity Asia完成对Thomson Scientific的收购,将其更名为科睿唯安(Clarivate Analytics)。

最开始,有些论文的质量不确定时,就在这个网站查看一下,以《Secure and Efficient Cloud Data Deduplication with Randomized Tag》论文为例,我们可以查看期刊影响力。JCR分区也是衡量一个期刊好坏的标准。也可以查看这篇论文的引用和被引用。
论文检索结果
期刊影响力

当然,这个网站以及后面要讲的网站及工具不仅仅只有这么一点作用,我讲到的只是冰山一角,更多的用处和使用技巧需要大家一起探索并分享。

3、SCI-HUB,https://sci-hub.shop/https://s1.sci-hub.org.cn/。SCI-Hub是世界上第一个向大众和公众提供数千万科研论文访问的pirate(翻印/盗版)网站,大部分学校都会买这些出版社论文的版权可以直接下载,但是没有版权时可以通过论文的DOI在这个网站上下载。用的不多,不多做介绍。

4、Google Scholar,谷歌学术,https://scholar.google.com/。根据自己的使用,谷歌学术应该是最全面的搜索引擎,功能也齐全,支持引文中检索,和多版本检索。在这些网站(不仅仅是谷歌学术)上一般都会有作者的主页,而谷歌学术的作者主页汇总的比较全面,也可以关注作者,看作者的最新研究进展。

国内可以使用谷歌学术镜像网站,数据基本是同步的。

5、四大出版社网站,IEEE Xplore(https://ieeexplore.ieee.org/Xplore/home.jsp),ACM DL(https://dl.acm.org/),Springer(https://link.springer.com/),Science Direct(爱思唯尔,https://www.sciencedirect.com/)也提供对应的论文检索功能。

6、中国知网(https://www.cnki.net/)。

五、论文检索与阅读

1、刚接触一个领域,想快速的了解这个领域的研究现状,可以先找一篇综述性文章,或者某篇文章的综述(related work)部分。

检索综述类论文时,可以带上关键字study、survey,review等,这三个是最常见的表明是综述类文章的关键字。注意综述类文章要求尽量的新,最好是近一年的,而综述类文章不需要必须是上面讲到的A、B类会议或A类期刊。

2、如何正确的输入关键字检索,有时候我们发现,直接告诉你一个研究方向也未必自己可以找到合适的论文,如果我们一点也不知道该用什么单词去检索,可以去知网等查找下中文的论文,在其中的英文摘要或者参考文献中找一下。

如果导师已经给你一篇文章,那么我们可以从这篇文章入手。既然是导师给你的文章,必定是有一定的代表性,或者比较有价值。我们首先需要认真阅读这篇文章,把该理解的部分一定要理解,最开始读论文,理解思想最关键,至于一些实在看不懂的公式或者技术可以先作为“黑盒”处理,以后再搞明白。

其中的综述(related work)部分认真阅读并理清楚此作者对其他论文及研究现状的评价,然后积累其中的关键词,用于我们检索论文。当论文中引用了其他论文中的技术时,在需要弄懂的时候,递归的搞明白。

3、对于SCI期刊还有一种可以确定期刊质量的标准,JCR分区。给一个可以查看期刊分区的网站,LetPub,以TIFS为例,如下图。

TIFS分区详情

学校认定一般是按照大类分区,我们可以看到TIFS在2020年12月升级版的中科院SCI分区中,大类属于计算机科学,且TIFS是1区,且属于顶刊。

当然SCI分区并不能完全代表论文的质量,需要看这个期刊在业界(尤其是小方向)的口碑。

六、论文“副产品”的检索

一篇论文发表,会伴随有很多其他的“副产品”,比如此篇论文的实现源码、系统,论文的其他版本、会议论文的报告PPT和视频。

以USENIX Security为例,其上的所有论文,在其官网上都可以下载到报告PPT以及报告视频。
USENIX论文详情

2、论文的其他版本。有些论文在刚写完后会将其托管到一些网站(比如arXiv和ePrint),申明论文的著作权,保护自己的知识产权,还有一个重要的原因,有时候期刊或者会议有页数限制,无法完全的展示,就会在这些网站上放完整论文。当然还有其他的版本,如作者的博客中的版本。这些版本论文对细节的描述往往更全面,更容易理解。所以对于某些必须要看懂却看不懂的论文找到其其他版本还是很有用的。

3、论文的源码。当我们看完某篇论文时,我们想要复现,如果有论文的源码是再好不过的了。当然并不是所有的论文都会公开源代码,更不是所有的论文都有源代码,针对有源码的论文,我们该如何查找呢。

大约从两个方向查找Github、作者的主页(如果是高校老师,可以是学校的教师主页,个人博客主页)。当然Github最开始也是按照作者的名字找其Github主页,看一下其repository目录中是否有,也可以直接检索论文名字或者论文中系统的名字。其次是去Google上,查找作者的资料,试图找到其主页,找到主页后可以看是否有源码。

当然,就算作者不给源码,有时我们也可以找到其他人复现此论文的源码,也可以作为参考。

4、数据集。推荐一个查找数据集的网站 Google的Dataset Search(https://datasetsearch.research.google.com/),这个用的不是很多,但是感觉还不错,不得不说,谷歌在搜索引擎方面还是强的。

七、其他

多啰嗦些工具。

1、Github。Gitbub真的是一个很好的网站,希望大家可以将其运用起来,在其上面可以找到的东西远不止代码,而且代码的托管功能也非常的实用。举个例子,著名的深度学习书籍,花书《Deep Learning》的翻译工作也是在Github上进行的,项目网址:https://github.com/exacity/deeplearningbook-chinese,你想找电子版duck不必某度网盘或者CS*N积分下载,在这里可以下载PDF版。

2、Markdown。Markdown是一种轻量级标记语言,很容易排版,支持latex公式。有时候我们好不容易在word中利用公式编辑器讲公式写完,又需要将其转到latex中,这就很麻烦,所以md中的公式很容易兼容latex。

3、LaTeX。是一种TEX排版系统,我们的论文基本要使用latex写作。而且大部分外文论文出版社都提供latex模板。具体介绍及安装见LaTeX与Sublime Text环境搭建 -扫雷篇

4、EndNote。其功能也很多,但是我把他定位为一个文献管理工具,当阅读或者下载的论文变多之后,自己用文件夹管理就很不方便,那么我推荐使用EndNote管理,分类分组、查看比较方便。

写在最后

以上方法与经验仅供参考,众所周知,方法总是多种多样的,所以本文仅在给大家提供思路,希望大家从中获得启发,找到属于自己的方法才是本文的最终目的。

全文写完再读来才发现并没有达到想要的目的,这些方法和经验都是自己在摸索中总结出来的,但是有些经验写不出来,只有实践多了才知道,只可意会不可言传,甚至不可意会不可言传。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值