Exploratory Social Network Analysis with Pajek(第三版)5-1

五、从属关系(Affiliations)

5.1 引言

组织成员身份或参与活动是社会关系的来源。在组织和活动中,人们聚集在一起是因为他们有相似的任务或兴趣,并且很可能进行互动。例如,体育俱乐部的成员对一项特定的运动有共同的偏好,并相互比赛或对抗。公司董事会的董事和专员共同对其财务成功负责,并定期开会讨论业务问题。受 Georg Simmel 社会学的启发,聚集在一个或多个组织和事件周围的一群人被称为社交圈。
在前面的章节中,我们研究了人与人之间的直接联系,例如朋友的选择,或其他社会实体之间的直接联系,例如国家之间的贸易关系。请注意,我们研究了一种行为者之间的关系:人与人之间或组织之间的关系,但不是人与组织之间的关系。现在,我们专注于后一种类型,称为从属关系。从属关系的数据可以相对容易地获得,它们在数据挖掘中非常流行。
从属关系通常是制度性的或“结构性的”,即受环境所迫。与情感和友谊相比,它们不那么个人化,也是私人选择的结果。当然,运动队的成员资格更多地取决于个人的偏好,而不是关押在特定的监狱病房,但即使运动队的组成也取决于情况以及教练和体育俱乐部当权者的决定。从属关系表示机构安排;由于制度塑造了社会的结构,从属关系网络告诉我们很多关于社会的信息。人们往往同时隶属于多个组织和事件,因此他们属于多个社交圈;或者,换句话说,它们是许多社交圈的交集。
社会可以被看作是
尽管成员名单并没有准确地告诉我们哪些人会互动、交流和互相喜欢,但我们可以假设他们有相当的机会会这样做。此外,一个组织的联合成员资格通常需要其他社会领域的相似性。例如,如果人们选择成为(或被接纳为)特定高尔夫俱乐部的成员,他们很可能具有相似的职业、兴趣和社会地位。不同类型的从属关系不会以随机方式重叠:社交圈通常包含按从属关系聚集到一种以上组织类型的人。从共享事件的数量或强度,我们可以推断出人们的相似程度。然而,这个论点可以反过来:分享更多成员的组织或活动在社交上也更接近。一个拥有众多来自当地商界精英的乡村俱乐部,可以说是商业领域的一部分。
在本章中,我们介绍了一种分析从属关系网络的技术,该技术侧重于边值。此外,我们还讨论了社交网络的三维显示。

5.2 例子

在政治学、经济学和社会学中,大公司董事会的组成受到了很多关注。谁是最大公司的董事;特别是,谁是几家公司的董事会成员?如果一个人是两家公司的董事会成员,那么他或她(尽管女性在这些职位上的出现频率较低)是一名兼职董事,他们在公司之间创建了一个联锁的董事会或联锁。
联锁的董事会网络告诉我们一些关于商业部门组织的信息。假设联锁董事是公司之间的沟通渠道。在一个董事会中,兼职董事可以使用在另一个董事会中获得的信息。信息可能会或可能不会被用来行使权力,这取决于董事所扮演的角色。如果由于社区内的社会声望而选举所选,他们为公司的公共关系提供服务,但他们不会影响其政策:他们符合象征性的作用。然而,拥有执行权的兼职董事可以协调多家公司的决策,从而控制经济的大部分。然后,联锁董事会是有权力的边。
在本章中,我们使用一个历史例子:20 世纪初(1904-5 年)苏格兰的企业联锁。十九世纪,工业革命带来了苏格兰铁路和工业化,尤其是重工业和纺织业。这些大型事业所需要的资金量超过了私人家庭的能力,因此可以筹集到所需的资金股份公司成立了。股份公司由股东所有,股东由董事会代表。这开启了联锁董事会的可能性。到 19 世纪末,股份公司已成为以牺牲私人家族企业为代价的主要商业企业形式。然而,家族仍然通过所有权和董事行使控制权。
数据取自 John Scott 和 Michael Hughes 所著的 The Anatomy of Scottish Capital 一书。它列出了 1904-5 年苏格兰 108 家最大的股份公司的 (136) 多名董事:64 家非金融公司、8 家银行、14 家保险公司和 22 家投资和房地产公司 (Scotland.net) 。这些公司根据行业类型分类(参见Industrial_categories.clu):1 - 石油和采矿业,2 - 铁路,3 - 工程和钢铁,4 - 电力和化工,5 - 国内产品,6 - 银行, 7-保险,8-投资。此外,还有一个向量以 1,000 英镑表示公司的总资本或存款(Capital.vec)。数据文件收集在项目文件 Scotland.paj 中。

5.3 双模和单模网络

根据定义,从属网络至少由两组顶点组成,因此从属关系仅连接来自不同集合的顶点。通常有两组,称为行为人和事件,例如董事(行为人)和公司董事会(事件)。从属关系将董事与董事会联系起来,而不是董事与董事或董事会与董事会,至少不是直接联系。
在这里插入图片描述

图 50 显示了苏格兰连锁董事网络的片段:一组董事(图中的“人”形,计算机屏幕上的“盒子”形)和公司(图中的“房子”形,“三角形” ”形状在您的计算机屏幕上)。在第 2 章中,我们学习了如何在 Pajek 的顶点中心绘制像“$”这样的 Unicode 符号。请参阅附录 2 以了解如何获得额外的顶点形状,例如“人”和“房子”以及曲边而不是直边。
网络文件以 FragmentScotland.paj 的形式提供。请注意,边总是连接第一组的顶点(绘制为“人”)和第二组的顶点(绘制为“房子”),例如,董事 J. S. Tait 与苏格兰联合银行。这种类型的网络称为二模网络或二部网络,在结构上与单模网络是不同的。在此之前我们分析的都是单模网络,所有顶点都可以在单模网络内部关联。

  • 在单模网络中,每个顶点都可以与其他每个顶点相联。
  • 在双模网络中,顶点分为两组,顶点只能与另一组中的顶点相联。

我们可以用通常的方式描述苏格兰董事职位的双模式网络,它的顶点数(108 家公司和 136 位兼职董事——参见从属关系划分)和边(358 个从属关系或董事会席位),组件的数量( 16 个没有兼职董事的孤立公司,3 个包含 2 个公司的小组件和一个大组件)及其度数分布。回想一下,如果网络不包含多重边和循环,则顶点的度数等于其邻居的数量。因为在董事网络中就是这种情况,所以公司的规模指定了其兼职董事的数量。这被称为事件的大小。董事的程度等于他或她所担任的董事会数量,称为参与率
在我们对双模网络的描述中,我们必须区分参与者和事件,因为度等简单的度量对于参与者和事件具有不同的含义。还有更多复杂性:对于双模网络,一些结构指标必须以不同的方式计算。例如,考虑完全网络的概念,我们将其定义为网络中可能的最大边数(参见第 3 章)。在单模网络中,这个数字远高于双模网络,因为每个顶点可以与单模网络中的所有其他顶点相连,但它只能与双模网络中的部分顶点相连、即处于其他模中的顶点。
因此,对于单模和双模网络,必须以不同方式计算双模网络的密度,即实际边数除以最大可能边数。分析单模网络的技术不能总是在不修改或改变含义的情况下应用于双模网络。双模网络的特殊技术相当复杂,超出了本书的范围。所以,我们能做些什么?常用的解决方案,我们将遵循的是将双模网络改为单模网络,可以用标准技术进行分析。
我们可以从双模网络创建两个单模网络:一个联锁事件网络和一个参与者网络,这些参与者是同一组织的成员或​​参加共同活动。
在这里插入图片描述

图 51 显示了从图 50 中的网络派生出来的公司(事件)的单模网络。它是按以下方式构建的。每当两个公司在双模网络中共享一个董事时,在单模网络中它们之间就有一条边。例如,J. S. Tait 在苏格兰联合银行和爱丁堡投资信托基金之间建立了联系,因为他是这两家公司的董事会成员。因为他也是国家担保协会的董事会成员,所以他负责三个公司之间的联系。每一条边都可以用他的名字来标记。此外,他为这些公司中的每一个都创建了一个环。与一个顶点发生的环数显示了它在双模网络中的邻居数。在我们的示例中,它显示了公司董事会中兼职董事的数量:事件的规模。简而言之,双模网络中的参与者成为单模事件网络中的边和环。
从图 51 可以清楚地看出,公司可以通过多重边连接,即在两家公司共享一名以上董事。因此,派生网络通常不是一个简单的网络。因为它也可能包含环,所以在解释从双模网络派生的网络中顶点的度数时必须小心。
多重边可以用一条边代替以获得一个赋值网络,边值表示两个顶点之间的原始边数。这样的边值称为边多重性。
在这里插入图片描述

图 52展示了可以从图 50 中的示例导出的董事(共同成员)的赋值网络。现在,双模式网络的事件由单模式参与者网络中的边和环表示。 J. S. Tait 在两家公司的董事会会议上会见了 W. Sanderson。我们相信您可以追踪负责该网络中边的公司。
虽然我们声明可以使用标准技术分析从双模网络派生的单模网络,但存在错误解释结果的风险。派生的单模网络中的直接联系很容易解释:它表明两个董事会有共同的董事,或者两个董事在一个或或更多董事会会面。没有直接联系意味着两个董事会不共享一名董事(例如,图 51 中的 Alliance Trust 和 Edinburgh Investment Trust)或两名董事不在董事会中开会,例如图 52 中的 A. Whitton 和 J. S. Tait .
由三个或更多顶点组成的子群的解释在派生的单模网络中更为复杂。图 51 包含三个大小为 3 的团。两个团是由于一个人的董事职位,即 P. W. Campbell 和 J. S. Tait,但一个团不是:苏格兰美国抵押贷款公司、联盟信托和苏格兰美国投资公司的三号团的存在归功于三位董事(坎贝尔、惠顿和梅特兰)。在一个赋值网络中,这种差异是不可见的,因为由董事姓名标记的多行被具有多重值的单行替换。在解释派生值网络时,将您关于共享人员(或事件)数量的结论限制为顶点对。对于三人组和更大的顶点集,您只能得出结论,它们共享一个或多个参与者或事件,但您不知道实际数量。
应用程序
Pajek 具有用于双模网络的特殊功能。对于双模数据,我们建议使用2-Mode 数据格式,这是一个普通的顶点列表和边列表,具有顶点列表排序的特殊功能:第一部分包含属于一个子集的所有顶点,其余部分列出另一个子集的顶点。在我们的示例(Scotland.net)中,编号为 1 到 108 的顶点是公司,而编号为 109 到 224 的顶点是兼职董事。数据文件的第一行指定顶点总数和第一个子集中的顶点数(例如,* Vertices 244 108)。
在这里插入图片描述

使用 Network> 2-Mode Network> Partition into 2 Modes 命令创建一个partition ,以区​​分第一个顶点子集(第 1 类)和第二个顶点子集(第 2 类)。该partition 在 Pajek 中通常称为“ffiliation partition”或“2-Mode”partition 。
Network> 2-Mode Network> 2-Mode to 1-Mode> Rows, Columns 子菜单 包含将双模网络转换为单模网络的命令。您可以在两个子系统中的每一个上创建一个单模网络
按照惯例,第一个子集的顶点称为行,而第二个子集的顶点称为列。这些项是从我们在第 12 章中介绍的矩阵符号派生的。在我们的示例中,第一个子集包含公司,因此 2-Mode 到 1-Mode 子菜单中的 Rows 命令将创建公司网络,前提是在主屏幕的第一个网络下拉菜单中选择双模网络。 Columns 命令创建一个董事网络。
如果您想知道新网络中每个顶点的关联数,请在导出单模网络之前选中 Include Loops 选项。根据您选择导出的子集,环指定参与者的参与率或事件的大小。选中选项Multiple Lines 后,派生网络将为每个共享行为人或事件包含一行,将创建行的事件或行为人作为标签。如果未选中此选项,则会创建一个没有多重边的有值网络,其边值表示边的多重性。通常,您不希望单模网络中有环或多重边,因此我们现在不勾选这些选项。
有一种简单的方法可以在 Pajek 中显示边值的分布;例如,可以通过执行 Network> Info> Line Values 的命令行值来显示派生的单模网络中的边多重性。在对话框中,您可以指定自定义类边界,也可以选择多个等宽的类。要获得等宽的类,请在对话框中键入一个以井号 (#) 开头的数字。通常,对话框建议的数字可以达到目的。
在这里插入图片描述
表 8 列出了苏格兰公司单模网络中边的多重性。第一类包含 231 行,其值不超过 1,包括 1。因为没有重数小于 1 的行,所以这个类包含所有重数为 1 的行:单行。下一个类包含值大于 1 的行,直到并包括值 2 的行。我们假设您将理解该类中的所有 28 行的重数为 2。它们指的是由两名董事联锁的成对公司。
您可以使用 affiliation partition 来区分两种模式(参与者和事件),从与双模网络关联的partition 或向量中选择一种模式的顶点。可以使用第 2 章中介绍的从一个partition 或向量中根据另一个partition 或向量提取一个或多个类的标准技术。 Network> Create Partition> Degree> Input Partitions> Extract SubPartition (Second from First)
假设我们想知道双模网络中公司的度数,等于它们的兼职董事的数量(事件的大小)。我们使用 Network> Create Partition > Degree> Input 命令以一般的方式计算度数。该命令创建的partition 不区分公司和董事,因此我们必须从中提取公司。我们在第一个partition 下拉菜单中选择 Degree partition 。接下来,我们选择affiliatio partition 作为第二个partition ,因为它标识了网络中的公司。最后,我们使用 Partitions> Extract SubPartition (Second from First) 命令从 Degree partition 中提取affiliatio partition 的类 1(公司)。现在,我们可以制作公司 Degree的频率分布(partition > Info)。同样,我们可以将属于双模网络的partition 转换为从它派生的单模网络。

5.4 岛屿

从双模附属网络衍生出的单模网络通常相当密集。它们包含许多团,因此如果我们想检测有内聚性的子群,我们可以分析重叠团或完整子网络的结构(参见第 3 章,第 3.6 节)。第 12 章介绍了有助于分析密集网络的其他技术。然而,在本章中,我们专注于基于边多重性的技术:岛屿。
多重边被认为更重要,因为它们不那么个人化,而更具制度性。从这个角度来看,我们可以根据边的多重性而不是邻居的数量来定义内聚子群。两家公司之间的联锁数量越多,它们的联系越紧密或更具内聚性,越相似或相互依存性越强。
在这里插入图片描述

例如,在图 53 中,四家灰色公司共有八名董事;它们由 8 级多重性的 6 行连接(比较表 8)。这些公司的联系比其他公司紧密得多,后者以 5 或更少的多重边连接。
这给我们带来了岛屿的概念:由边的多重性或值定义的子网络。在岛内,顶点通过特定最小值的边直接或间接连接,而它们以较低的值连接到岛外的顶点。

  • 岛屿是由边直接或间接连接的最大顶点子网,其值大于与子网外部顶点的边。

如果我们使用与该顶点入射的边的最高值作为其高度,则可以将岛屿视为网络中的局部顶点。因此,岛是一组高于其周围环境的顶点。这意味着可以在不同的高度找到岛屿:平坦平原上的小丘,例如荷兰的 Vaalserberg(海拔 1,059 英尺),或山脉中的明显山峰,例如斯洛文尼亚的 Triglav(9,396 英尺)。在图 53 中,我们手动将等高边添加到苏格兰公司单模网络中的岛屿。轮廓给人一种岛屿高度的感觉。图 53 顶部中间的四个深灰色顶点代表四家公司共享八名董事的岛屿。该岛与其周边地区有着明显的区别,因为与岛外公司的联系最大重数为 2。
在这里插入图片描述

图 54 显示了具有公司工业类别(来自 Industrial_categories.clu 的类别编号)及其经济价值的岛屿(由 Capital.vec 确定的顶点大小)。图 53 中的大组成部分现在被分解为许多岛屿:一种类型的公司的几个小岛屿(国内产品 [第 5 类]、铁路 [第 2类]、电力 [第 4 类]和投资 [第8类])和一个主要由金融机构(银行 [6 类]、保险公司 [7 类] 和投资银行 [8 类])连接的较大岛屿。在这个大岛上,富有的喀里多尼亚铁路和苏格兰寡头基金占据了举足轻重的地位。我们可以得出这样的结论:多元联锁将金融组织联系起来,而不是在这个历史例子中将金融领域与重工业或消费品生产联系起来。
应用
在一个赋值网络中,Network> Create Partition> Islands> Line Weights 命令识别岛屿。它忽略了有向网络中边的方向。发出时,此命令会询问岛屿的最小和最大大小。默认的最小大小为 1。如果你提高这个最小值,小岛将被忽略。除非您的网络包含许多无趣的小岛,否则您可以使用1或2个作为最小岛大小。
岛屿的最大尺寸有点棘手。它应该足够大以包含网络中的大型有趣岛屿。但是,如果最大尺寸大于或等于该组件或岛,它可能会忽略该组件或岛内的差异边值。因此,如果要检查组件是否存在由具有相对较高值的边连接的局部顶点簇(Cluster),则应将最大尺寸设置为低于该组件的尺寸。苏格兰公司网络中唯一的大组件包含 86 个顶点,因此应将最大值设置为低于此数字,例如设置为 70。
island 命令生成一个partition 和一个向量。在partition 中,每个检测到的岛都分配有一个类别编号,其中的顶点不属于岛的一部分归集到第 0 类中。向量将定义岛的边值分配给岛的一部分的顶点——它们的“高度” 。如果在执行 island 命令之前设置了选项 Network> Create Partition> Islands> Generate Network with Islands,它还会生成一个新网络,其中包含所有顶点和仅定义岛的边。在这个网络中,岛屿是弱组件。
图 54 显示了苏格兰公司网络中的岛屿,其工业类别为类别编号,顶点大小由公司资本决定。不属于岛屿的顶点按以下方式移除。首先,为岛屿网络创建了一个度partition 。其次,使用 Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters 命令从网络中提取具有至少一个邻居(partition 类 1-*)的顶点。新网络仅包含原始 108 个顶点中的 51 个,因此行业类别划分和资本规模vector不适合新网络。要使它们适合,请使用 Partitions> Extract SubPartition (Second from First)(确保 Industrial_categories.clu 和 island partition 被选为第一和第二个partition )和 Operations> Vector + Partition> Extract SubVector(确保 island partition 在第 2 章(分别为第 2.4 节和第 2.5 节)中讨论的第一个partition 下拉菜单中选择的命令。如果您绘制新的网络、partition 和向量(命令 Draw> Network + First Partition + First Vector),您将获得与图 54 中描述的相似的社会图,前提是您使用 Kamada–Kawai 优化获得的布局分离组件的命令(布局>弹性> Kamada-Kawai>分离组件)。
最后,Pajek Classes 提供了一个强大的工具,通过 Export> 2D> SVG子菜单在 Web 上显示交互岛。
在这里插入图片描述

在下拉菜单中选择企业的单模网络和岛屿partition 。然后,绘制Network 和partition ,并在 Draw 屏幕的子菜单 Export> 2D> SVG> Line Values 中执行命令 Nested Classes,以获取包含网络绘图的 HTML 文件和 SVG 文件。对话框询问 HTML 的名称用来存储绘图和活动partition 中必须由不同层表示的类的数量。在后一种情况下,接受对话框中建议的默认编号。
如果您在 Internet 浏览器中打开此文件(有关详细信息,请参阅附录 2),您将在其右侧看到社会图和一组复选框。每个复选框都与一类边相关联。如果您取消选择一个复选框,所有值不超过并包括取消选择的类的所有边条以及不属于其余岛屿的顶点都将从图片中删除。使用复选框,您可以交互地查看不同多重性级别的边和顶点。如果复选框因任何原因不起作用,请尝试使用其他浏览器。例如,Mozilla Firefox 在编写本书时运行良好。
在本书的网站 (http://mrvar.fdv.uni-lj.si/pajek/) 上,自动加载文件 island.svg 的 HTML 文件 island.htm 提供了一个示例。请注意,取消选中 (1.00 …2.00] 复选框,最大岛(包含 20 个顶点)中的部分边消失了,因此将岛分解为五个较小的岛。由于岛的最大大小设置为超过 20,该命令在 20 个顶点的集合内没有区分。这说明了最大尺寸设置对岛命令结果的影响。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值