2021山东大学众智期末复习笔记

森哥0708

已于 2022-06-07 21:29:23 修改

阅读量2.5k

点赞数 5

分类专栏：期末复习文章标签：图论

于 2022-06-07 20:41:11 首次发布

本文链接：https://blog.csdn.net/qq_42430054/article/details/125172826

版权

期末复习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

社交网络

强连通图：有向图G中，任意两点可以相互到达。

有向图的强连通分量：有向图中的极大强连通子图。

三元闭包：如果两个互不相识的人有了一个共同的朋友，则他们俩成为朋友的可能性提高。

强三元闭包原理：若节点A与节点B、C的关系都是强联系，且B与C之间无任何连接(强或弱),则称节点A违反了强三元闭包性质。否则，称节点A满足强三元闭包性质。

桥：若删除A-B边，会导致A、B属于不同的连通分量，则A-B边为桥。

捷径：若边A-B的端点A、B没有共同朋友，则把A-B边成为捷径。

断言：社交网络中，若节点A满足强三元闭包性质，并由至少两个强联系边与之相连，则与其连接的任何捷径都是弱联系：

证：反证法，若节点A满足强三元闭包性质，并由至少两个强联系边与之相连，假设与其连接的一捷径是强联系，捷径的另一节点为B。

∵A要与至少两边形成强联系，很明显捷径是其一，则存在点C使A-C是强联系

又∵A满足强三元闭包性质，则B-C必有联系，现在A、B有共同朋友C

∵A-B是捷径，则A、B应无共同朋友，矛盾

证毕。

节点A的聚集系数 = A的任意两个朋友之间也是朋友的概率（即邻居间朋友对的个数除以总对数）

图A节点A的聚集系数 = 1/6，图B节点A的聚集系数 = 3/6=0.5

邻里重叠度

定义：与A、B均为邻居的节点数/ 与节点A、B中至少一个为邻居的节点数。

介数的计算：P48、52页

判断一个图是否是二分图？

法一：广度遍历，奇数层和偶数层分开。一个图是二部图，当且仅当其中不存在长度为奇数的圈。图中存在奇数长度圈，当且仅当广度优先搜索结果中存在同层的边。

法二：染色法，把图中的点染成黑色和白色。首先取一个点染成白色，然后将白色点的无色邻居染成黑色，黑色点的无色邻居染成白色。如果发现有相邻且同色的点，那么就不是二分图。

同质性

同质性的简单测度

给定一个二色图G，让p为一种颜色节点占比，q=1-p对应另一种颜色节点占比。两端颜色不同的边出现的概率为2pq。（端点异色边数／总边数）小于2pq，则可认为同质性明显。

现在的总边数为18，其中两端点异色的有5条。 5/18 < 8/18 = 4/9 于是我们说同质性在该网络有一定体现

社团闭包：加入一个社团的两个个体之间形成联系；

会员闭包：B受朋友A的影响加入了A的社团。

选择形成社团闭包，社会影响形成会员闭包。社团闭包和会员闭包形成社会归属网，同质性是社会网络形成的基本外部原因。

A为邻接矩阵，B为归属矩阵，A(i,j): i与j的连接关系，B(i,j): i是否加入j，A(i,): A的第i行向量，B(,j): B的第j列向量。 1.“三元闭包”：若A(i,j)=0，且A(i,)×A(j,)≥3，则A(i,j)将＝1 2.“社团闭包”：若A(i,j)=0，且B(i,)×B(j,)≥2，则A(i,j)将＝1 3.“会员闭包”：若B(i,j)=0，且A(i,)×B(,j)≥2，则B(i,j)将＝1

固有特质：性别，母语，种族等；可变特质：居住区，专长，偏好等

谢林模型的意义：

隔离是同质性的影响与结果（固有特质相同->可变特质相同）

如因为肤色（内在相同）相同，而住在一起（外在趋同）
即使没有人刻意要求隔离的结果，但隔离也会出现
同质性拉近具有相同不变特征人们之间的距离

正负关系

结构平衡性质:对于每三个节点组,与它们相关联的三条边,要么都标识为“＋”,或者恰有一条边标识为“+”。 平衡定理:如果一个标记的完全图是平衡的,则要么它的所有节点两两都是朋友,要么它的节点可以被分为两个组X和Y,其中X组内的节点两两都是朋友,Y组内的节点两两也都是朋友,而X组中的每个节点都是Y组中每个节点的敌人。

弱平衡网络：只是**不存在（＋、＋、- ）**三角关系的标注完全图。

完全结构的弱平衡：如果⼀个标记的完全图是弱平衡的，他的节点可以分为2个及以上的不同组，并且满⾜统⼀组中任意两个节点互为朋友，不同组中任意两个⼈互为敌⼈。

⾮完全图的平衡判断：

查看阵营之间是否有奇数圈，有奇数圈就不能形成二分图，就不平衡。

小世界

六度分隔：人类社会网络中，任何两个人之间最短路径长度都不超过“6”。

大型社会网络的特点/小世界现象表明了什么？

大型社会网络包含丰富的短路径
不借助任何地图，人们能有效的找到那些短路径
两人建立关系的可能性随“社会距离”递减

形成社会⽹络的两种基本⼒量：

同质性（对应亲近的关系，⼤部分在地理范围内）
弱联系（认识远程的⼀个朋友）

Watts-Strogatz模型

Watts-Strongatz模型的特点：兼具同质性（人们与志同道合的人建立关系）和弱连接（能让人们与网络中较远的人建立关系），抽象的表达了社会网络成因的基本特征，从理论上说明了小世界现象的必然性。

Watts-Strongatz模型的问题：它解释不了Milgram实验的另一个重要现象——短路径不仅存在，而且通过短视搜索能发现。

Watts-Strogatz-Kleinberg 社会⽹络模型

在Watts-Strogatz模型基础上，让两个节点之间存在随机边的概率与距离的某个幂次（q）成反比。Watts-Strogatz模型证明不了短路径不仅存在，⽽且能通过短视搜索发现。

q：控制远程连接的概率随距离递减的强度。q值较⼩，随机边倾向于较远。q 值较⼤，随机边倾向于较近。

搜索引擎

万维⽹中⼀篇⽹⻚具有两⽅⾯的属性：中枢值和权威值。

被很多⽹⻚指向：权威性⾼，认可度⾼。

指向很多⽹⻚：中枢性强。

权威更新规则：对于每个⽹⻚p，以所有指向该⽹⻚的⽹⻚中枢值之和更新这个⽹⻚的权威值auth（p）。

中枢值更新规则：对每个⽹⻚p，以它指向的所有⽹⻚的权威值之和来更新他的中枢值。

HITS算法：计算⽹⻚的权威值（auth）和中枢值（hub）

步骤：以先计算权威值，再计算中枢值的顺序，反复进行权威值和中枢值的更新。最后记得归一化：每个权威值除以所有权威值的总和，每个中枢值除以所有中枢值的总和。

PageRank：把网页排名看成一种通过网络流通的“流体”,沿着边从一个节点流到另一个节点,汇集在一些最重要的节点上。每个网页均等地将自己当前的网页排名值分配给所有向外的链接,这些链接将这些均等的值传递给所指向的网页。

随机游⾛：想象⼀个⼈从⼀篇随机选择的⽹⻚开始，随机选择其中的链接浏览到下⼀篇⽹⻚，并不断如此进⾏，称为“随机游⾛”。到达X的概率等于运⾏PageRank得到的排名值。

博弈论

博弈的三个要素:参与人，策略集，回报

占优策略：有一个策略的收益总和大于等于其余所有策略的收益总和。

严格占优策略:对一个参与人来说，若存在一个策略，无论另一个参与人选择何种策略，该策略都是严格最佳的选择，则这个策略就称为是该参与人的严格占优策略。

可以看出，参与人1的严格占优策略是策略D。
严格占有策略不⼀定每个参与⼈、每次博弈都会有。

最佳应对策略：对于敌人的单个策略，我有一个最佳的应对策略。

严格最佳应对策略：对于敌人的单个策略为他的严格占优策略时，我有一个最佳的应对策略，这个应对策略就是严格最佳应对策略。

最佳应对策略：公司1策略为高档时，公司2的最佳应对策略为廉价；公司1策略为廉价时，公司2的最佳应对策略为高档。

严格最佳应对策略：公司2已看破公司1会选择廉价（因为这是公司1的严格占优策略），公司2以高档为严格最佳应对策略。

纳什均衡:互为最佳应对的策略组。一般来说，纳什均衡并不一定能给出唯一的预测但是能有助于缩小预测范围。

带随机性的混合博弈

混合策略的均衡：一个参与人所采用的概率是使对方在他的两个策略中无差异。

纳什的奠基性贡献:证明了具有有限参与者和有限纯策略集的博弈一定存在纳什均衡（包括混合策略均衡)

社会福利：⼀个策略组对应的回报的总合。

社会最优：社会福利的最⼤策略组合。

社会最优和纳什均衡有可能⼀致。从社会应⽤的意义讲，均衡与社会最优⼀致的系统是理想系统。

布雷斯悖论:投⼊资源，效率反⽽更低。给⼀个博弈增加⼀个新策略，会使情况变得更糟。

增价拍卖（英式拍卖）:卖⽅逐渐提⾼售价，竞拍者不断退出，直到剩下最后⼀位买家，这个买家以最终价赢得商品。

降价拍卖（荷兰式拍卖）:卖⽅从最⾼价逐步降价直到第⼀个竞拍者接受并⽀付当前价格。

⾸价密封拍卖:竞拍者同时向卖⽅提交密封报价，卖⽅同时打开，出价最⾼者以其出价赢得商品。

次价密封拍卖:竞拍者同时向卖⽅提交密封报价，卖⽅同时打开，出价最⾼者以第⼆⾼出价赢得商品。

为何次价密封拍卖鼓励真实报价:

当你报出真实报价时，有以下两种情况：

第一，你获得了交易权。此时，你有正的回报

-提高报价不会改善回报; -降低报价，若不低于第二个人的，也不会改善回报，若低于第二个人的，则失去了交易权，回报变成0（减少了)

第二，你没有获得交易权（有人出价X>100）。此时，你的回报为0。

-降低报价不会改变现状; -提高报价，若不高于第一个人的报价，也不会改善回报，若高于第一个人的，你赢得交易权，但要支付原来第一个人的报价(高于你的估值)，于是回报为负（减少了)

市场

完美匹配：当⼆部图的两边有数⽬相同的节点，⼀个完美匹配就是左右节点的配对当且仅当

每个节点都有边连接到另⼀列的节点
不会出现左边两个节点同时连到右边同⼀个节点上

受限组：⼀组节点的边限制了完美匹配的形成。取右边的任何⼀组节点S，在左边且与其相连的点为N（S），表⽰所有S邻居的集合。 S的数量>N（S）的数量，则S为受限组。

匹配定理：如果⼀个两边节点相等的⼆部图⽆法形成完美匹配，那么它⼀定包含⼀个受限组。

市场清仓价格的最优性:对于任何一组市场清仓价格,一个偏好卖家困中的完美匹配使估值总和在所有买家与卖家的分配中达到最高。

市场清仓价格的生成步骤：

卖家初始价格为0
构造收益矩阵
构造偏好卖家图
查看是否有受限组。若有，提高价格；若没有，此时就是清仓价格。

GSP价格：次价。

VCG价格：补偿价格。VCG价格=V(S,B-j)-V(S-i,B-j)，即买家j不出现和买家j出现的情况下，其他买家的商品总估值（出价）之差。

GSP不鼓励真实出价，VCG鼓励真实出价

VCG为什么鼓励真实出价？

答：

权力

不稳定因素：不在结果中的一条边，其两端点的价值之和小于1，则次边为不稳定边。

稳定结果：不在结果中的所有边，其两端点的价值之和大于等于1。

讨论两个节点之间的权力关系，可以通过“外部选项”判断。外部选项越大，说明你退路越多，在这个权力关系中越有优势。

纳什议价解：双方满意于均分s = 1-x-y

对于A: x+s/2 =(x+1-y)/2

对于B:y+s/2 =(y+1-x)/2

x+y<1 , 0≤x<1 , 0≤y<1

稳定结果:不在结果匹配中的边，两端节点的赋值之和不小于1。平衡结果:在结果匹配中的边，两端节点的赋值满足纳什议价解。

证明:平衡结果一定是稳定结果。

答：平衡结果⼀定是稳定结果，但是稳定结果不⼀定是平衡结果。因为在⼀个平衡的结果中，匹配中的每个节点⾄少得到它的最好的外部选项，因此不存在两个节点有积极性来通过利⽤⼀条当前未⽤的边来破坏⼀个平衡结果。

从众

贝叶斯公式：

P（A|B）=P（A）*A（B|A）/P（B）

蓝多罐和红多罐问题。

假设第一个学生摸到蓝球，那么他要比较P（maj-b|b）和P（maj-r|b）的大小，谁大那我就猜是什么罐。

于是算出P（maj-b|b）= P(maj-b)·P(b|maj-b)/P(b)=2/3

P（maj-r|b）= P(maj-r)·P(b|maj-r)/P(b)=1/3

很明显，他要猜是蓝多罐。

假设第二个学生也摸到蓝球，那么他也要比较P（maj-b|b,b）和P（maj-r|b,b）的大小，谁大那我就猜是什么罐。

于是算出P（maj-b|b,b）= P(maj-b)·P(b,b|maj-b)/P(b,b)=4/5

P（maj-r|b,b）= P(maj-r)·P(b,b|maj-r)/P(b,b)=1/5

很明显，他要猜是蓝多罐。

假设第三个学生突然摸到红球，那么他要比较P（maj-b|b,b,r）和P（maj-r|b,b,r）的大小，谁大那我就猜是什么罐。

于是算出P（maj-b|b,b,r）= P(maj-b)·P(b,b,r|maj-b)/P(b,b,r)=2/3

P（maj-r|b,b,r）= P(maj-r)·P(b,b,r|maj-r)/P(b,b,r)=1/3

很明显，他虽然抽到红球，但是他要猜是蓝多罐。

级联开始的条件：某种信号连续的出现三次，可以开始形成级联。

n趋于无穷时候，一定会形成信息级联的原因：

什么导致幂律分布：增长性和择优性是产生幂律分布的一种机制，以及许多不同的过程和作用也会导致幂律分布

以⽹⻚流⾏性分布为例构建⼀个⽹⻚互联简单模型

以概率 p，均匀随机地选择⼀个早先创建的⽹⻚，建⽴⼀个到该⽹⻚的链接.
以概率1-p，均匀随机地选择⼀个早先创建的⽹⻚，建⽴⼀个到该⽹⻚所指向的⽹⻚的链接。

例：设p=1/4,分别计算节点5连接到每个节点的概率？

幂率分布的特点：极端不均匀性（度跨度很⼤）、标度不变性。

“⻓尾”理论：销量很⾼，但书的种类远远低于平均值的书，反⽽盈利更⼤，它存在于幂率的⻓尾之中。

新事物的扩散

⽹络传播的级联⾏为

完全级联：如果最终采⽤A的级联导致每个节点都从B转到A，我们称这个初⽤节点集产⽣⼀个临界值为q的完全级联。

级联⾏为与病毒式营销

有的时候，门槛值还不够低，无法大规模扩散。这时候就开始有策略了：

策略1：提⾼A的产品质量。即a=3→a=4，使⻔槛值下降，这样所有节点最终都会选择A 。专业术语：较低的⻔槛值能够使A闯⼊当前⽹络中那些拒绝他的区域。
策略2：让使⽤B的少部分关键⼈物转为使⽤A，这些⼈要经过精挑细选，以达到级联效应。

级联与聚簇

聚簇定义：我们称⼀个节点集合为密度为p的聚簇，若其中每个节点⾄少有占⽐为p的⽹络邻居也属于这个节点集合。

例如聚簇abcd，可以发现每个节点至少有占比为2/3的邻居属于这个节点集合，则2/3就是聚簇密度。

策略A攻不进抱团紧的区域，说明同质性往往可能成为扩散的阻碍。⼀个同质性区域称为⼀个聚簇。

根据聚簇的密度判断是否能形成完全级联

断言:考虑一个行为A的初用节点集,剩余网络中的节点采用行为A的门槛值为q。

r如果剩余网络包含一个密度大于1一q的聚簇,则这个初用节点集不能产生一个完全级联。
并且,如果一个初用节点集不能产生一个完全级联,并且门槛值为q,则剩余网络一定包含一个密度大于1一q的聚簇。

证明级联定理，给定门槛值q和初用节点集

若剩余网络中存在密度大于1-q的聚簇，则其中每个节点（B）都有至少1-q占比邻居在这个聚簇中，于是谁也不可能被“首先攻破”→完全级联不可能形成
若级联形不成，则剩下的每一个节点都有大于1-q占比的邻居节点都依然采用B，于是它们就构成了一个密度大于1-q的聚簇

基本级联模型的拓展——异质⻔槛值

异质⻔槛阻塞聚簇：剩余⽹络中的⼀个节点集合，其中任何节点v都有超过1-Qv占⽐的邻居也在该集合中。

形成级联：1→3→2、5→6→4。也没传播到全部节点。

共同知识的意义：

共同知识是了解邻居行动的重要基础
一个社会体系实际上是一个共同知识体系
共同知识构建了对他人行动预期的依据，尤其是在相对稳定的结构化社会网络中，共同知识可以成为默认的行为准则
但当不存在共同知识的时候，宣传就会发挥建构共同知识的作用（是最直接，最有效的手段）

信息不对称

制度追求与个⼈追求的博弈

制度追求：希望达到全局最优，不希望个⼈逐利损耗制度的初宗，或者出现意想不到的副作⽤。
个⼈追求：⼀般在制度下追求⾃⾝利益的最⼤化。（当然利他主义者等是特例）

制度下群体⾏为的两种基本区分

外⽣事件：给的选择好坏是固有的，与个体如何做决定⽆关。
内⽣事件：事件如何发⽣直接取决于⼈们的⾏动状况。

两类市场

仅考虑参与者的⾏动对市场动态的影响，或两者之间的互动，则可以讲市场划分为两类。

外⽣事件市场：事件发⽣的概率不受⾏动者参与⾏为影响。⽐如⽆论多少⼈去买彩票，彩票的中奖率就在那⾥，⼀直不变。
内⽣事件市场：事件发⽣的概率受到⾏动者参与⾏为的影响。⽐如如果将交通看做市场，每个驾驶者的参与会对交通时间产⽣直接影响。

线性效⽤函数：谁的赔率高就全买谁。

对数效⽤函数：谁的胜率高就押多少胜率比例的钱。

赔付率

Oa=压在A和B上的钱/压在A身上的钱

Ob=压在A和B上的钱/压在B身上的钱

（状态）单位价格：赔付率的倒数，即赌客为了得到一块钱回报需要正确下注的钱数。

**柠檬市场，**即“劣币驱逐良币”。

(阿克罗夫）柠檬市场的要点：

市场中的商品有多个质量等级
买家和卖家对每一等级商品有不同的底线价格（设同一等级中买家估值>卖家底价）
买卖双方对每一具体商品的质量信息不对称因此买家只可能出一个期望价格，卖家按照所持有具体商品的底价与买家给出的价格的关系决定是否出售
期望价格与不同等级商品的占比分布和估值有关

市场失效的原因:质量较差商品占比太高，买卖底价差太小。

⼈⼒资源市场例⼦

流⾏病和线粒体夏娃

分⽀过程：每个⼈⾛到⼈群中遇到K个不同的⼈，并以独⽴的概率P将疾病传染给遇到的每个⼈。

基本再⽣数和⼆分法：

基本再⽣数（1个能传染的邻居⼈数）：R0 ， R0 = pk 如果R0<1，疾病将在有限的疫情波后以概率1消失。如果R0>1，疾病将在每⼀波以⼤于0的概率传染⾄少1个⼈。即使R0>1，疾病以⼤于0的概率持续传播，并不是绝对会持续传播。
当p<1时，总是会有些机会使最先感染的⼏个⼈不再传染给其他⼈，导致疾病消失。
R0接近于1的时候，有“⼑刃”特性。
R0略低于1，但是p⾼，结果可能会使R0最终⾼于1，疾病突然⼤爆发。
略微减少疾病的传染性（降低p）将导致R0减⼩降低⾄1以下，可以消除疾病⼤范围流⾏的⻛险。

SIR

易感期S（susceptible）,传染期I（infectious）,移出期R（removed）

感染流程：