Exploratory Social Network Analysis with Pajek(第三版)4-1

四、情感和友谊

4.1 引言

在前一章中,我们讨论了在社交网络中寻找有内聚性的子群的几种技术。属于用一个子群的人往往比不是同一个子群的人更频繁地互动。在本章中,我们将这一概念扩展到积极或消极的情感关系,例如,友谊与敌意,喜欢与不喜欢。我们预计子组内会出现正向关系,子组之间会出现负向关系。关于情感关系模式的假设源于社会心理学,它们被广泛称为平衡理论。首先,我们介绍这个理论并讨论它是如何被纳入网络分析的。然后,我们将其应用于情感关系,即主观的和心理的而非有形的社会关系。

4.2 平衡理论

社会心理学对群体过程及其对个人行为和感知的影响感兴趣。在 1940 年代,Fritz Heider 提出了一个原则,该原则已成为平衡理论的核心,即当一个人在某个话题上与他或她的朋友意见相左时会感到不舒服。
在这里插入图片描述

图 42 说明了这种情况:P 是一个人,O 是另一个人,X 代表一个主题或对象。 P喜欢O,用P和O之间的正边表示;然而,他们在主题 X 上存在分歧,因为 P 支持它(正边),而 O 反对它(负边)。请注意将负面关系绘制为虚边的惯例,Pajek 也采用了这种惯例。
海德预测,P 会变得压力大,并有改变这种不平衡的冲动,要么通过改变他对 O 的感情,来调整自己对X的观点,或者通过让自己相信 O 并不真正反对 X。小团体的研究证实了人们在不平衡的情况下感到压力的假设。
一种特殊的网络可以表示情感联系的结构,即符号图。在符号图中,每条边都附有一个正号或负号,指示相关联的关系(例如,一种感情)是正的还是负的。

  • 符号图是每条边带有正号或负号的图。

在符号图中,Person-Other-Object 三元组由一个循环表示,即第一个和最后一个顶点重合的路径。所有平衡循环都包含偶数个负边或根本没有负边;比如图42的循环中有一条负边,是一个奇数,所以这个三元组是不平衡的。 P,可能还有 O,在这种情况下会感到压力。
然而,情感关系不需要是对称的。我对你的感觉可能与你对我的感觉不同。感情是从一个人投射到某事或其他人的。因此,通常最好用弧而不是边来表示情感联系。很容易将平衡理论推广到有符号有向图:忽略弧的方向,并计算每个半环(闭合半路径)中负弧的数量。
在这里插入图片描述

在图 43 中,从 P到X,到O,再回到P 的弧序列构成半路径和半环,但不是路径和环,因为并非所有弧都指向该序列中的下一个顶点。半环是不平衡的,因为它包含奇数个负弧。

  • 环是一条封闭的路径。
  • 半环是一个封闭的半路径。
  • 如果一个(半)循环不包含奇数个负弧,则它是平衡的。

Fritz Heider关心一个人的感受和看法。因此,图 43 包含了人 P 对另一个人O 以及对对象或主题 X 的感情。甚至 O 与 X 的关系也是从 P 的角度来衡量的:它是 P 关于 O 对 X 的看法的想法,而不是必然符合O的真实意见。在社会心理学中,这种现象称为归因( attribution)。当然,O 也可能对 P 产生积极或消极的影响,如果 X 是人(或动物)而不是话题,X 也可能表达对 P 和 O 的感情。
网络分析师对一个群体中所有成员对彼此的感受感兴趣。这导致了结构平衡的概念,该概念期望人类群体内部情感联系的整体模式保持平衡,而不是一个人的情感和归因。
符号图的平衡有确切的条件。一个平衡的符号图可以划分为两个簇(Cluster),使得所有正弧都包含在一个簇(Cluster)内,所有负弧都位于不同簇(Cluster)之间。你可能会说一个平衡的网络是极端两极分化的,因为它由两个派系(factions )组成,行为人只与自己派系(factions )的成员有积极的联系,而他们与其他派系(factions )的成员有消极的联系。簇(Cluster)将彼此喜欢但不喜欢其他集群成员的人分组。
在这里插入图片描述

在图 44 中很容易检查这一点,它使用灰色和黑色来识别簇(Cluster)。此外,证明了一个符号图是平衡的当且仅当它的所有半环都是平衡的。找到一个不平衡的半环,你就知道网络是不平衡的。

  • 如果所有(半)环都是平衡的,则符号图是平衡的。
  • 一个符号图是平衡的,如果它可以被划分为两个簇(Cluster),使得所有正关系都包含在簇(Cluster)内,所有负关系都位于簇(Cluster)之间。

为什么人类群体会由两个簇(Cluster)或派系(factions )组成,而不是三个或更多?例如,在图 44 中,顶点 v7、v9 和 v12 本身很可能是一个簇(Cluster)。为了允许三个或更多簇(Cluster),平衡被推广到集群性。如果有一个partition 满足正边连接簇(Cluster)内的顶点并且负边连接不同簇(Cluster)中的顶点的标准,则有符号网络是可聚类的,无论簇(Cluster)的数量如何。结果表明,如果一个网络不包含恰好有一条负弧的半环,则它是可聚类的。显然,平衡是可聚类性的一个特例,因为所有平衡的半环都是可聚类的。

  • 如果一个环或半环不包含恰好一个负弧,则它是可聚类的。
  • 一个符号图是可聚类的,如果它可以被划分成簇(Cluster),使得所有正关系都包含在簇(Cluster)内,而所有负关系都位于簇(Cluster)之间。

随着时间的推移,平衡理论已被推广到包含层次结构的模型。我们将在第 10 章介绍这些模型。其中一些适用于无符号网络,但我们仅在当前章节中分析有符号关系。为了在无符号网络中找到子群,我们建议使用追踪内聚子群( tracing cohesive subgroups)的技术,这些技术将在第 3 章中介绍。

4.3 例子

在本章中,我们使用了一个网络分析师多次再分析的案例,即塞缪尔·桑普森(Samuel F. Sampson)对新英格兰修道院社团(community)结构的民族志研究。该研究描述了一群准备加入修道院的男性(沙弥)之间的几种社会关系。我们使用沙弥之间的情感关系,通过要求他们指出他们最喜欢谁和最不喜欢谁来收集这些情感关系。沙弥被要求在这两个问题上进行第一、第二和第三选择。
社会关系分几次被测量。 Sampson.net 文件包含五个不同时刻的情感关系。最喜欢的对等点的第一个选择用线值3 编码,第二个选择用线值2 编码,第三个选择用线值1 编码。最不喜欢的选择用负线值编码如下: – 3 表示最不喜欢的同事,-2 表示第二选择,-1 表示第三选择。然而,在本节中,我们关注的是在第四时刻(T4)的沙弥之间的感情关系,那是在他们中的四人被逐出寺院前一周。为了便于说明,我们仅使用他们的第一选择,重新编码为 1 表示最喜欢,-1 表示最不喜欢。数据可在文件 Sampson_T4.net 中获得。 Pajek 项目文件 Sampson.paj 包含所有网络和partition 。
一些沙弥在来到修道院之前就读过“修道院”的小神学院;它们在partition Sampson_cloisterville_T4.clu 中被标识为 1 类。根据他的观察和分析,Sampson 将沙弥分为四组,由partition Sampson_factions_T4.clu 中的类表示:青年土耳其人(1 类)、忠诚反对派(2 类)、被驱逐者(3 类)和间质组(第 4 类)。忠诚反对派由最先进入寺院的沙弥组成。青年土耳其人后来到了,正值一个变化时期。他们质疑修道院的做法,忠诚反对派成员为之辩护。一些沙弥在这场辩论中没有选边站,所以他们被贴上了“间质式”的标签。 被驱逐者是不被接纳为团体的沙弥。

4.4 检测结构平衡和可聚类性

社交网络很少是完全平衡或可聚类的。在某些应用中,研究人员想知道一个社交网络是否比我们随机预期的更平衡或更容易聚集(见第 13 章)。如果是这样,他们的结论是网络中的参与者调整他们的联系以平衡。然而,在探索性社交网络分析中,我们主要对检测平衡簇(Cluster)感兴趣,这些簇(Cluster)代表网络中的凝聚子组。
有几种方法可以检测带符号网络中的集群,例如正边在集群内,负边在集群之间。有时,可以通过可视化探索找到簇(Cluster)。如果我们画出尽可能短的表示引力的正边和尽可能长的表示斥力的负边,那么在社会图中可以清楚地看到积极的集群。在以这种方式绘制的图 45 中(如“应用程序”部分所述),我们可以看到沙弥网络中的三个集群。因为存在三个集群,所以网络是可聚类的,而不是平衡的
因为网络是高度可聚类的并且不是很密集,我们可以直观地检查所有正弧都位于簇(Cluster)内,并且几乎所有负弧都从一个簇(Cluster)指向另一个簇(Cluster)。簇(Cluster)中唯一的负弧指向社会图底部的 John Bosco 到 Mark。请注意,三元组 John Bosco、Mark 和 Gregory 恰好包含一个负弧,因此它是不可聚类的,并且在我们可能尝试的任何聚类中都会产生问题。
在这里插入图片描述

在图 45 中,顶点颜色和类别编号表示桑普森描绘的团:青年土耳其人(黑色,第 1 类)、忠诚反对派(浅灰色,第 2 类)、被驱逐者(白色,第 3 类)和间质组(深灰色 ,第 4 类)。青年土耳其人(黑色)和忠诚反对派(浅灰色)之间的社会分裂是显而易见的,被驱逐者的聚类性不是很好。Ramuald 和 Victor 聚集在忠诚的反对派中,他们可能觉得与他们有些关系,因为他们(路易斯除外)都来自 Cloisterville。
如果社会图不像图 45 那样有序,我们必须使用计算技术来找到最适合平衡或可聚类性的聚类。在探索性网络分析中,一个好的策略是尝试许多簇(Cluster)并选择包含最少数量禁止边的簇(Cluster),所谓禁止边指簇(Cluster)之间的正边或簇(Cluster)内的负边。禁止边(不一致)的数量是衡量网络平衡或聚类程度的错误分数:更多错误意味着更少的平衡或聚类。
在图 45 中,如果我们将沙弥划分为三个簇(Cluster),则只有一条禁止边,即右下簇(Cluster)中从 John Bosco 到 Mark 的负弧。由研究人员决定平衡程度或可聚类性是否可以接受。如果不使用估计技术就无法指定标准,这超出了本章的范围,因为错误分数的可接受性取决于网络的大小和密度。错误分数(error score)允许我们选择最合适的聚类,但它并不能说明它是否足够好。
一遍又一遍地将顶点重新排列成簇(Cluster)并选择最佳解决方案的方法是一种优化技术,具有三个值得注意的特征。首先,优化技术可能会找到几个同样适合的解决方案或partition 。由研究人员选择一个或全部呈现。
其次,这种技术可能无法找到最合适的聚类,尽管预计这只会在特殊情况下发生。然而,不能保证没有更好的解决方案,当然,除非您找到一个完全适合的聚类。我们建议多次重复该过程并可视化检查结果,看看您是否能找到更好的解决方案。
第三,启动选项可能会产生不同的结果;例如,如果告诉程序寻找两个簇(Cluster)而不是三个或四个簇(Cluster),则该程序会找到另一种解决方案。通常可以从一个充满活力的社会图估计簇(Cluster)的大致数量,但很难说出会产生最低错误分数的簇(Cluster)的确切数量。因此,重要的是重复使用不同数量的簇(Cluster)的优化技术。
此外,用户可以将不同的权重或罚则归因于禁止的正弧和负弧。例如,研究人员注意到,簇(Cluster)内的负弧比簇(Cluster)之间的正弧的容忍度要低,因此我们可以提高对簇(Cluster)内负弧的罚则。在图 45 描绘的沙弥之间的情感关系网络中,这意味着 John Bosco 对r Mark的消极情绪比gregory对John Bosco的积极情绪更重要。因此,优化技术将在 John Bosco 和 Gregory 之间拆分底部集群。不同的权重可能会产生不同的结果。
应用
最小化正边长度和最大化负边长度的社会图可以分两步制作。首先,在绘图屏幕的[Draw]Options>Values of Lines>Similarities子菜单中选择选项Similarities。
在这里插入图片描述

此选项告诉能量过程边值表示相似性或吸引力:边值越高,应绘制的两个顶点越接近。负边值意味着顶点不同,必须画得很远。在 Pajek 中,边的符号由边值的符号(例如 1 和 –1)表示,因此在能量图中,正弧很短,负弧很长。请注意,在选择另一个选项之前,此选项一直有效。其次,将能量程序应用于社会图。图 45 是使用 Kamada–Kawai 能量命令创建的。
在这里插入图片描述

Doreian–Mrvar Method∗ 用于在符号网络中搜索最优聚类的命令位于 Network>Signed Network>Create Partition 菜单中,因为它只能应用于符号网络。网络包含必须聚类的顶点和关系。此外,我们需要一个partition 来指定集群的数量和计算机试图改进的初始集群。 (译者注,此时, Doreian–Mrvar Method命令还不能用,需要先用下一段的说明生成一个Partition)
如果您没有具有有意义的初始聚类的partition ,您可以使用 Partition 菜单中的 Create Random Partition> 1- Mode 命令轻松创建随机partition 。此命令发出一个带有两个问题的对话框。第一个问题询问partition 的顶点数或维度。默认情况下,Pajek 显示网络中当前活动的顶点数,这是正确的数字,因为您希望partition 适合此网络。在第二个字段中,输入要在网络中检测的集群数量。在此示例中,您可能希望获得三个集群。
Network> Signed Network> Create Partition> Doreian–Mrvar Method∗ 命令打开一个新窗口,用于指定集群中的重复次数、错误权重和最小顶点数(单击改变)。
确保Relaxed balance复选框保持未选中状态。当我们选择Relaxed balance时,我们将一些违反结构平衡的情况视为属于其他相关过程(例如,调解、差异化的受欢迎程度和内部子群体的敌意;请参阅进一步阅读。)结构平衡的放松思想允许我们对有符号的双模网络进行partition 。我们将在第 5 章介绍(无符号)双模网络。如果您对划分有符号双模网络感兴趣,请查看进一步阅读部分中引用的论文。
在每次重复中,Doreian–Mrvar Method∗ 命令从一个新的随机partition 开始。(此处的重复次数,指的是 Doreian–Mrvar Method∗ 命令对话框中设置的参数,不是让读者重复执行 Doreian–Mrvar Method∗ 命令)
在这里插入图片描述

如果起始partition 非常适合,则优化技术将找不到更好的解决方案,因为所有更改最初都会增加错误分数。例如,这可能发生在基于对能量社会图的可视化检验的起始聚类中。对于几个随机起始partition ,该过程不太可能错过与您的期望有很大差异的良好聚类,尽管不能保证这一点。在小型网络中,100 次重复是一个合理的首选,但如果计算机需要很少的时间来进行 100 次重复,建议您尝试更多的重复次数。(此处的重复次数,指的是 Doreian–Mrvar Method∗ 命令)
在这里插入图片描述

接下来,您必须指定禁止负弧的误差权重,即正簇(Cluster)内的负弧。这个权重称为 α,默认为 0.5。错误正弧的误差权重等于 1 – α,因此默认情况下,负弧和正弧被同等对待。如果你想处置一个禁止的负弧而不是一个错误的正弧,例如,将对话框中的 α 提高到 0.75。因此,禁止正弧的权重为 0.25,这是附加到不合适的负弧的权重的三分之一。最后,通过增加簇(Cluster)中的顶点数最小值,您可以避免得到仅包含一个或几个顶点的簇(Cluster)。
图 46 显示了沙弥网络的结果。我们使用包含三个类的随机partition 作为起始partition ,并指示它平等地衡量正负误差(α= 0.5)。首先,列表显示初始聚类中的错误分数和错误弧。有许多错误,由它们的边值(1 或 –1)和它们在行列表中的顶点编号来标识。使用您自己的随机起始partition ,您可能会发现不同的错误列表。但是,您应该找到与此处显示的解决方案相匹配的最终解决方案,因此让我们专注于它们。
通过足够的重复,Doreian–Mrvar Method∗ 命令找到三个解,其中恰好有一个“禁止”弧。在第一个聚类中,正弧错误地连接了顶点 7(Mark)和 2(Gregory),这显然是不同聚类的成员。在第二个聚类中,从顶点 1 (John Bosco) 到顶点 7 (Mark) 的负弧是一个问题,因为它位于一个聚类内。在第三个聚类中,从顶点 2 (Gregory) 到顶点 1 (John Bosco) 的正弧会导致问题。正如预期的那样,不可聚类的三元组 John Bosco-Mark-Gregory 导致了这些问题。尽管如此,聚类几乎是完美的,因此我们可以得出结论,网络是可聚类的。要知道它是否也平衡,我们必须使用包含两个集群的起始partition 重复该过程
所有最佳解决方案都保存为partition 下拉菜单中的partition 。用这些partition 绘制网络,我们可以看到左侧和顶部的集群是正确的,底部以三种方式拆分(图 47):
在这里插入图片描述

将 Mark 添加到 Simplicius、Elias 和 Amand 的簇(Cluster)中(解决方案 1);他是一个不可分割的簇(Cluster)的一部分,包括 Gregory 和 John Bosco(解决方案 2);或者他与与 John Bosco、Basil、Hugh 和 Winfrid 分开的 Albert、Boniface 和 Gregory 分组(解决方案 3)。如果一个簇(Cluster)内的负弧被认为比簇(Cluster)之间的正弧更容易出现问题,那么第一个和最后一个解决方案最有可能。例如,尝试将 α 设置为 0.6 的方法。
让我们以警告结束本节。 Doreian–Mrvar Method∗ 命令触发了一个非常耗时的过程,因此它不应该应用于具有超过数百个顶点的网络,除非您暂时不需要您的计算机
在 Pajek 中,应仅应用于小型网络的命令在菜单中用星号标记

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值