网络分析,图挖掘常用数据集:dblp dataset,kdd dataset....

网络分析,图挖掘方向的同学相信都曾因为没有数据苦恼。真实的数据往往需要爬取网页,但往往会遇到被封ip的危险。项目组要爬取开心网的数据,号召我们每人申请20个账号,估计还是不够用。

下面是自己找过的一些数据,对于社会计算,图挖掘方向会有帮助。

1.snap.stanford.edu/na09/resources.html 这个网站给出了非常多的 有用的数据集包括:dblp data, kdd data,imdb database ,邮件网络,博客网络,等等。此外还给出了一些实用的工具进行网络分析,数据呈现等。

2。citeseerx.ist.psu.edu/about/metadata 此地址给出了citeseer 数据的下载方式,citeseer数据包括合作者,引文等信息。关于citeseer的下载办法,参见本博客的另一篇文章citeseer data的下载方法。

3。Cora dataset 的下载地址www.cs.umass.edu/~mccallum/code-data.html    关于更详细的数据介绍请看hi.baidu.com/zhudaohui/blog/item/4e6f86fdc4df791e08244d12.html

4。dblp 数据下载地址dblp.uni-trier.de/xml/ dblp 数据量较大,数据包括 合作者,日期,但是一般不包引文信息.


转载自 http://hi.baidu.com/fanhengguang/item/30c50647adeb5dd8c0a59220

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值