社交网络与社会计算课程内容梳理总结

这是一篇关于社会计算的课程内容总结,涵盖了社交网络服务、内容计算、群体智慧和网络表示学习等方面。文章讨论了社会计算在社交网络、信息传播、推荐系统和话题演化等任务中的应用,并介绍了复杂网络的图要素、度量和模型。重点讨论了复杂网络的度如度中心性、特征向量中心性、介数中心性和紧密度中心性等,并涉及贝叶斯网络和主题模型。
摘要由CSDN通过智能技术生成

1 引言

社会计算是指社会科学和计算技术交叉融合而成的一个研究领域,研究如何利用计算系统帮助人们进行沟通与协作,研究如何利用计算技术分析社会运行的规律与发展趋势,即以社交网络和社会媒体为研究对象,从中发现社会关系、社会行为的规律。

社会计算的研究内容包括:

  1. 社交网络服务,包括:社会关系强度、信息的绝对价值和相对价值、新鲜事排序算法、隐私性以及社会化搜索;
  2. 内容计算,包括:舆情分析、人际关系挖掘、微博应用;
  3. 群体智慧,比如百度百科和维基百科。

社会计算的研究理论工具:

  1. 从数学和社会心理学等其他学科借鉴来的理论,比如图论、平衡论、社会比较理论、六度分割理论、150定律;
  2. 本源的社会网络理论,比如异质性理论、结构角色理论;
  3. 网络时代大数据的研究方法

社会媒体是指互联网上基于用户关系的内容生产与交换平台,其特点有:1)多对多;2)丰富的用户交互特性。

社会媒体数据通常用图或者矩阵的形式进行表示。现实世界中的大规模网络往往具有一些共同的性质:无标度分布、小世界效应、强社区结构。

社会媒体挖掘的意义:

  1. 社会媒体挖掘研究将是推动社会学与信息科学交叉发展的着力点;
  2. 社会媒体数据研究已经成为提高国家信息产业科学化水平和舆情态势感知能力的支撑点;
  3. 社会媒体挖掘是引领新型互联网经济发展的制高点。

社会媒体挖掘的挑战:

  1. 可扩展性;
  2. 混杂性;
  3. 演化;
  4. 集体智慧

本课程关注的社会计算任务:

  1. 社区发现与演化分析,包括1)如何发现社区?2)社区结构时如何演化的?3)怎样评价发现的社区;
  2. 信息传播与影响建模,包括1)如何建模社会媒体上的信息扩散?如何挖掘社会媒体上的关键节点?3)用户间是如何相互影响的?4)如何求解影响最大化问题?5)如何对网络传播进行追踪溯源?6)如何预测信息热度?
  3. 兴趣发现与推荐系统,包括1)经典的推荐算法有哪些?2)基于社会媒体的推荐系统如何构建?3)如何评价推荐系统的性能?
  4. 话题发现与演化追踪,包括1)话题发现的模型和算法有哪些?2)话题演化的模型和算法有哪些?3)如何应对大规模、动态、多源数据的挑战?
  5. 链接预测与网络推断,包括1)链接预测的基本方法有哪些?2)异质社会媒体上连接预测如何实现?3)网络推断的效果如何评价?
  6. 行为分析与建模预测,包括:如何刻画用户的采纳和忠诚程度?2)如何建模用户个体的使用行为?3)如何建模用户群体的互动行为?
  7. 社会媒体的情感分析、任务分析、安全、可视化,等等。

2 复杂网络的图要素

复杂网络是指那些结构复杂、无规则、随时间动态变化的网络。

哥尼斯堡七桥问题:只有当图中度为奇数的顶点不超过两个,这样的路径才存在。

图的基础知识:

  1. 节点与边;
  2. 有向边与有向图;
  3. 邻居;
  4. 度和度的分布

图的表示:

  1. 邻接矩阵;
  2. 邻接表;
  3. 边列表

图的类型:

  1. 零图和空图;
  2. 有向图、无向图、混合图;
  3. 简单图与多重图;
  4. 带权图;
  5. 标号图

通路是指依次遍历相邻边产生的边序列,分为开通路闭通路。通路可以用边序列或者节点序列表示。通路的长度是指经过的边的数量。边不重复的通路称为简单通路,闭合的简单通路称为环路。节点和边都不重复的通路称为路径,闭合的路径称为回路欧拉环路是指图中所有边均只被遍历一次的环路,哈密尔顿回路是指遍历了图中所有节点的回路。如下图所示:

图的连通性:如果节点 v i v_i vi和节点 v j v_j vj之间有路径连接,那么称节点 v i v_i vi可连接到节点 v j v_j vj,即可达。无向图的可达性对称,有向图的可达性不一定对称。任意节点相互可达的有向图称为强联通有向图,不考虑相互约束,称为弱连通有向图。同理可以基于子图和连通性定义连通分支强连通分支弱连通分支

最短路径可以使用Dijstra算法和Prim算法进行求解。

图的直径是指任意两个节点之间距离中的最大值。图的平均距离是指图中所有节点对的距离的平均值。

特殊图包括:树、森林、生成树、完全图、平面图、二分图、正则图

图算法:最大流算法、Prim算法、Dijstra算法。

3 复杂网络度量

度中心性认为具有更多链接关系的节点具有更高的中心性,我们可以使用最大可能度数(n-1)、最大度数、度数和对度中心性进行归一化。

特征向量中心性是度中心性的一种扩展,其试图通过结合无向图中的邻居节点的重要性来修正度中心性,计算如下: c e ( v i ) = 1 λ ∑ j = 1 n A j , i c e ( v j ) c_{e}\left(v_{i}\right)=\frac{1}{\lambda} \sum_{j=1}^{n} A_{j, i} c_{e}\left(v_{j}\right) ce(vi)=λ1j=1nAj,ice(vj)

Katz中心性修正了特征向量中心性的一个缺点:没有入边的特征向量中心性为0,计算如下: C K a t z ( v i ) = α ∑ j = 1 n A j , i C K a t z ( v j ) + β C_{\mathrm{Katz}}\left(v_{i}\right)=\alpha \sum_{j=1}^{\mathrm{n}} A_{j, i} C_{\mathrm{Katz}}\left(v_{j}\right)+\beta CKatz(vi)=αj=1nAj,iCKatz(vj)+β

PageRank中心性认为并不是中心性用户所关注的每一个人都是中心性用户,解决方案是让中心性除以节点的出度,这样每个邻居节点获取源节点中心性的一部分。 C p ( v i ) = α ∑ j = 1 n A j , i C p ( v j ) d j o u t + β C_{p}\left(v_{i}\right)=\alpha \sum_{j=1}^{n} A_{j, i} \frac{C_{p}\left(v_{j}\right)}{d_{j}^{\mathrm{out}}}+\beta Cp(vi)=αj=1nAj,idjoutCp(vj)+β

介数中心性度量方法是考虑节点在连接其他节点时所表现出来的重要性,计算其他节点间最短路径中有多少条要通过节点??,这个比重是多少,公式如下: C b ( v i ) = ∑ s ≠ t ≠ v i σ s t ( v i ) σ s t C_{b}\left(v_{i}\right)=\sum_{s \neq t \neq v_{i}} \frac{\sigma_{s t}\left(v_{i}\right)}{\sigma_{s t}} Cb(vi)=s̸=t̸=viσstσst(v

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值