基于FP-Growth的频繁项集挖掘与基于社交图的关联规则挖掘
一、任务简介 1
二、数据集 1
三、基本思路 2
3.1、发掘各个会议的“核心”研究者 2
3.2、挖掘作者之间的合作关系 3
3.3、挖掘导师-学生关系 5
四、正确性验证 5
五、总结 5
一、任务简介
本次挖掘任务有三个:第一,发掘各个会议的“核心”研究者,具体包括在相应会议上的发表文章数量、活跃时间范围等;第二,挖掘作者之间的合作关系,并使用一定的权值表示合作的紧密程度;第三,挖掘导师-学生关系。
二、数据集
数据来自DBLP的十二个会议从2000年至今的所有论文,十二个会议分别是:{"SDM":1, "ICDM":1, "ECML/PKDD":1, "PAKDD":1, "WSDM":1, "DMKD":1