数据挖掘
收一伞烟雨_
这个作者很懒,什么都没留下…
展开
-
推特情感分析-基于spark
参考链接:使用spark Mlib 数据集下载:由于对Twitter的操作需要FQ,为方便大家进行后续实验操作,我们已将数据保存至tweets.json, donald.json及hillary.json中,json 文件地址将在后续实验操作时给出。tweets.json包括和川普及希拉里有关的推特,而donald.json和hillary.json仅包括其文件名代表的候选人有关推特。...原创 2018-07-11 16:42:02 · 2327 阅读 · 1 评论 -
基于spark的社交网络分析-社团挖掘-链路预测-scala实现
基于spark的Facebook社团挖掘 数据集:SNAP数据中的facebook数据集 从图论的角度来说,社团挖掘问题就是相当于一个图的分隔问题,即给定一个图G=(V,E),顶点集V表示社交网络中的用户,边集E表示用户之间的友好关系,社团挖掘的目的就是找到一种最优的分割图的方法,使得分割后形成若干个子图,跨越不同子图的边的数量尽可能得小,同一个子图内部的边的数量尽可能大。最常见的衡量...原创 2018-07-11 16:56:26 · 2571 阅读 · 1 评论