前言
在空间网络中挖掘(k,r)-core。空间网络可以是图,但根据一些大佬的定义是具有空间属性的点组成的图。(k,r)-core是空间网络中的子图,它满足两个约束:结构性约束和相似性约束,它还有一个隐藏约束:连通。结构性约束是指(k,r)-core中每个顶点至少有k个
数据下载
第1章的所有社区挖掘工作都是基于Brightkite数据集的,Brightkite数据集是一个基于位置的社交网络平台提供的用户签到信息,用户在签到时会共享位置信息,所以每条签到数据都有一个位置信息。
在此给出Brightkite数据集的下载地址。
下载地址:http://snap.stanford.edu/data/loc-brightkite.html
数据分析
SNAP将Brightkite数据集构建成了无向空间网络图,其中数据集包含loc-brightkite_edges.txt.gz 和 loc-brightkite_totalCheckins.txt.gz两个文件,分别对应空间网络中的边集和点集。
loc-brightkite_totalCheckins.txt.gz 数据集大小364M,可使用010editor编辑器来查看规模较大的数据。
loc-brightkite_totalCheckins.txt.gz 保存的是点的信息,数据集中每条信息都是一次签到信息,由用户id、签到时间、纬度、经度和位置ID五种属性构成。每个用户可签到多次,所以一个用