由于研究要用到DBLP数据集,所以这段时间一直在与其作斗争,遇到了很多困难,有点小收获特此记录一下,方便自己和对这方面有兴趣的同学学习,少走些弯路。话不多说,我们开始吧~
DBLP简介
http://blog.csdn.net/ss654271961/article/details/78259546 这篇博客里面有详细的介绍,这里就不再细说。
DBLP的API
DBLP数据文件1G多,假如不需要所有数据或者对获取数据速度没较高要求的话,可使用它的API。这里官网发了篇文章,里面解释了DBLP的基础API以及用法,还有几个例子(java、C)。
我们以其中两个API为例:
(一)获得一个作者的所有发表论文
http://dblp.uni-trier.de/pers/xk/urlpt
urlpt是作者的标识
示例:http://dblp.uni-trier.de/pers/xk/s/Sun:Yizhou
其中,s/Sun:Yizhou为作者的姓氏首字母再加姓名全拼。请求的部分结果如下图所示
dblpkey是论文的唯一标识,通过改变urlpt可以得到任何作者的合作者。
(二)获得一个作者的所有合作者
http://dblp.uni-trier.de/pers/xc/urlpt
urlpt是作者的标识
示例:http://dblp.uni-trier.de/pers/xc/s/Sun:Yizhou
请求的部分结果如下图所示