【趣说算法】从独立空间谈社交网络分析

目录

1 网络可视化

2 使用度、中介和紧密中心性研究社会关系

3 参考工具


我们每天都在和微博、微信这样的社交网络打交道,基于社交网络,我们可以做网络可视化,也就是将社交网络里的人际关系结构可视化输出;利用中心性分析法,我们也可以研究社会关系。

图片来源:Make Money With Social Media - Entrepreneur's Diaries 

1 网络可视化

关于网络可视化,从我们每个人的感受谈起。我们期望被朋友、亲人、爱人关爱, 却依然拥有自己独立的空间。这一点类似于来源于物理学的质点弹簧算法,各结点彼此向对方施以推力并试图分离,而结点间的连接则试图将关联结点彼此拉近。当我们知道一些社交网络里人际关系结构的事实数据时,我们可以利用质点弹簧算法生成一个易于理解并且不杂乱无章的网络图。这张网络图的布局是这样的:未关联的节点被推离,而关联的节点则被彼此拉近,却又不会靠得很近。看看下面这张清晰的网络布局图。

 图1:中文名网络图

由于质点弹簧算法无法避免交叉线,我们很难在一个拥有大量连接的网络中观察结点的关联情况,但是我们可以使用优化算法来构建布局,也就是只需要确定一个成本函数,例如计算彼此交叉的连线数,并令其值尽可能地小。无交叉连线优化算法(no-crossed-lines optimization)可以产生出这样的布局。


 

2 使用度、中介和紧密中心性研究社会关系

基于社交网络,我们可以根据以下度、中介和紧密等3个中心性来研究社会关系。

 图2 英文人名网络图

注:Bill还连接了Mark,图中未显示。

描述

使用情景

例子

度中心性

表示在社交网络中,一个结点与其他很多结点都发生直接联系,那么这个结点就处于中心地位

关注交往活动,入度可以看作这个结点的受欢迎程度,出度可以看作这个结点的合群程度。出度指这个结点指向其他结点的链接数,入度指指向这个结点的链接数。

图1中,显示王二最受欢迎

中介中心性

是指某结点出现在其他结点之间的最短路径的个数

关注结点对信息的控制,这个结点相当于一个闸,和它相连的结点想要到其他结点都得经过它

从图2可以看出,Bill和Joseph的间接中心性远高于其他结点, Willian和Tom只有依赖Joseph才能和其他人建立连接。如果没有Bill,Mark会与其他人断开关系。James、Mark、Henry和Tom不在其他关系的路径上,所以他们的中介中心性为0

紧密中心性

用来考察一个结点在传播信息时对其他结点的依赖程度

研究信息传播的独立性和有效性。如果一个结点离其他结点越近,那么他传播信息的时候也就越不需要依赖其他人。一个结点到网络中各点的距离都很短,那么这个点就不会受制于其他结点。

还有特征向量中心性,留着下次再说。

3 参考工具

NodeXL是一个不错的社交网络分析工具,可以参考以下网站 

 NodeXL: network analysis & insights as easy as pie charts

这是NodeXL生成的一张网络图。

 

欢迎大家一起来讨论社交网络分析。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值