山东大学软件学院众智科学与网络化产业期末复习考点分类背过就有100分 2024

最新推荐文章于 2024-06-28 21:03:42 发布

见路不走QWQ

最新推荐文章于 2024-06-28 21:03:42 发布

阅读量1.4k

点赞数 19

文章标签：分类数据挖掘人工智能

本文链接：https://blog.csdn.net/m0_74094649/article/details/140047614

版权

众智题型总结，PPT梳理，2024，刚考过，持续更新，点个赞呗~关注一下呗~众智一定考高分

楼主觉得看完这个每个题型都看懂大差不差但是考试时候还是有一些主观题，比较开放，需要认真理解，不可以纯背题。。

祝大家都能99+

第一章、不考，但要理解其中的一些图论基本概念，比如桥、捷径之类的

桥：若删除A-B边，会导致A、B属于不同的连通分量，则A-B边为桥。

捷径：若边A-B的端点A、B没有共同朋友，则把A-B边成为捷径。

强连通图：有向图G中，任意两点可以相互到达。

有向图的强连通分量：有向图中的极大强连通子图。

第二章(社会网络)、三元闭包，证明捷径是弱关系//三元闭包自动化求解（ppt上有，就是两个矩阵乘法那个）

三元闭包

快照：某一时刻社会网络图的形状

三元闭包：如果两个互不认识的人有了一个共同的朋友，则他们俩将来成为朋友的可能性会提高。

节点A的聚集系数=A的任意两个朋友之间也是朋友的概率

度分布函数P(k)表示网络中度为k的节点在整个网络中所占的比例。

节点（或边）介数=网络中所有最短路径中经过该节点（或边）的概率之和

证明捷径是弱关系

强三元闭包：

如果A-B和A-C之间的关系为强关系；则B-C之间形成边的可能性很高，如果B-C之间没有关系（强或弱），则称A点违背了强三元闭包原理。

可以将社交网络中所有关系归为两大类：强关系和弱关系

捷径：若边A-B的端点A和B没有共同的朋友，则称A-B边为捷径。
捷径和弱关系：若节点A符合强三元闭包，且至少有两个强关系邻居，则与A相连的任何捷径必定意味着弱关系。

证明：（反证法）

已知一社交网络及一节点A，满足强三元闭包性质并至少涉及两个强联系边，假设A和B直接有一捷径相连，且该捷径为强联系。由于A、B之间为捷径，则没有共同朋友，但根据强三元闭包原则，又必须有共同朋友，因此矛盾，因此预期相连的捷径均为弱联系。

other

第三章（同质性）、同质性的度量、三元闭包，会员闭包，社团闭包自动化求解（ppt上有，就是两个矩阵乘法那个）

同质性的度量

1.同质性：我们和自己的朋友往往会有相同点每个人的特质分为两种——固有特质（性别，种族，母语等自然属性）和可变特质（外部属性，比如兴趣爱好等）社会学一个问题：人们是因为相似才成为朋友还是成为朋友之后变得相似？

三元闭包，会员闭包，社团闭包自动化求解//解释三元闭包，社团闭包，会员闭包，选择和社会影响

同质现象的背后机制选择性：人们倾向于和他们相似的人成为朋友 -> 社团闭包社会化：人们也会因为需要和朋友们保持一致而改变自己的行为 ->会员闭包

选择形成社团闭包，社会影响形成会员闭包。社团闭包和会员闭包形成社会归属网，同质性是社会网络形成的基本外部原因。

固有特质：性别，母语，种族等；可变特质：居住区，专长，偏好等

谢林模型的意义：

隔离是同质性的影响与结果（固有特质相同->可变特质相同）

如因为肤色（内在相同）相同，而住在一起（外在趋同）
即使没有人刻意要求隔离的结果，但隔离也会出现
同质性拉近具有相同不变特征人们之间的距离

第四章（正负关系）、平衡定理和弱平衡定理的证明，局部平衡全局平衡

平衡定理和弱平衡定理的证明

边的正负性——支持(+)与反对(-)；朋友(+)与敌人(-)

社会网络中三角关系的稳定性

社会网络图的结构平衡：若图中所有三角关系都是平衡的，则该完全图结构平衡。（用定义来判别不方便）

完全结构的弱平衡：如果⼀个标记的完全图是弱平衡的，他的节点可以分为2个及以上的不同组，并且满⾜统⼀组中任意两个节点互为朋友，不同组中任意两个⼈互为敌⼈。

完全图平衡，非完全图平衡

近似平衡的网络：允许存在少量三角形不平衡

讨论一个非完全图结构的平衡性 (1) 可以添加适当的边形成平衡的完全图 (2) 可以分成两个敌对阵营这两种定义等价

非完全图结构的平衡性简单判别图是平衡的，当且仅当它不包含奇数个负关系的边的圈。（当且仅当广度优先搜索时不存在同层的边）

也可以判断图中每个方格中负关系边是否均为偶数

第五章（小世界）、没找到考点...大家也还是看看吧

六度分隔：人类社会网络中，任何两个人之间的最短路径长度都不超过6
大型社会网络的特点/小世界现象表明了什么？
- 大型社会网络包含丰富的短路径
- 不借助任何地图，人们能有效的找到那些短路径
- 两人建立关系的可能性随“社会距离”递减
形成社会网络的两种基本力量：同质性，弱关系

3.Watts-Strogatz模型（r,k）

很好地体现了地理位置上的远近想象这个网格是很大的，上亿节点“网格距离”的概念；

让所有网格距离小于或等于r（同质连接的参数）的结点之间都有一条边；让每个节点都有k（弱关系连接的参数）条随机边－有可能连接到“很远的”节点

疑问：弱连接的概率应该随距离的幂次递减，k值确定弱链接的方式似乎不能反映真实情况

4.Watts-Strogatz-Kleinberg模型在Watts-Strogatz模型基础上，让两个节点存在随机边（弱关系）的概率与距离的某个幂次（q）成反比。

理论结果：q=2时，分散搜索达到最佳效果。导致最短的分散搜索路径

第六章（搜索引擎）、Hits算法和pagerank，要会算和理解。pagerank同比缩减也要掌握，随机游走了解

Hits算法和pagerank，要会算和理解

搜索引擎的基本问题：对用户提交的一个查询，从海量网页集合中将可能满足用户需求的少数结果找出来
网页的中枢与权威性(一篇网页可以兼具两个性质) 权威性：被很多网页指向中枢性：指向很多网页
HITS算法：计算网页的权威值（auth）和中枢值（hub）计算方法：

示例

（上图是运行4轮）（步骤：以先计算权威值，再计算中枢值的顺序，反复进行权威值和中枢值的更新。最后记得归一化：每个权威值除以所有权威值的总和，每个中枢值除以所有中枢值的总和。）但是，auth和hub数值会随着迭代次数递增，什么时候收敛？数值的意义在于相对大小 —— 在每一轮结束后做归一化（值/总和，auth和hub分别的总和）归一化结果随迭代次数会趋向于一一个极限。

PageRank：利用网页间的链接关系计算网页重要性

PageRank：把网页排名看成一种通过网络流通的“流体”,沿着边从一个节点流到另一个节点,汇集在一些最重要的节点上。每个网页均等地将自己当前的网页排名值分配给所有向外的链接,这些链接将这些均等的值传递给所指向的网页。

示例

用最朴素的语言讲出PageRank算法的思想用最朴素的语言讲出PageRank算法的要点

PageRank与HITS算法对比 PageRank不需要归一化但有可能出现共谋制造垃圾网页的情况

改进 —— PageRank的同比缩减与统一补偿

随机游走：PageRank的一种等价理解

问题：考虑一篇网页x，问经过k步随机游走到达x的概率是多少？证明：到达x的概率等于运行PageRank基本算法k步得到的值。

第七章（博弈论基础）、理解几种博弈，会利用无差异性原理计算混合策略求解

理解几种博弈，三个要素:参与人，策略集，回报

1.收益矩阵

2.严格占优策略：对一个参与人来说，若存在一个策略，无论另一个参与人选择何种策略，该策略都是严格最佳的选择，则这个策略称为是前者的严格占优策略。（如上图中“我”的严格占有策略是复习考试）

最佳应对策略：对于敌人的单个策略，我有一个最佳的应对策略。

严格最佳应对策略：对于敌人的单个策略为他的严格占优策略时，我有一个最佳的应对策略，这个应对策略就是严格最佳应对策略。

3.囚徒困境

4.营销战略博弈

5.严格占优策略与不严格占优策略严格与不严格的区别，看是＞还是≥

6.纳什均衡：都不改变策略的策略组（互为最佳应对的策略组）

7.鹰鸽博弈总共有6个食物，如果是两个鸽子分则一人3个，如果是一只鹰和一只鸽子分则鹰5个鸽子一个，如果是两只鹰分则两人都为0

其中两个纳什均衡为（鹰，鸽）和（鸽，鹰）

想一下，如果你出鸽子的话，我最好出什么，

如果我出了这个，你最好出的什么，一组的话，就是纳什均衡

（为什么没有鹰鹰，因为如果鹰鹰，两人都是0，我不如换成鸽，还能拿一个)

8.零和博弈 —— 不存在纳什均衡的博弈

利用无差异性原理计算混合策略求解

混合策略的引入

混合策略均衡求解：对于某个人而言他的两个策略的收益一致

社会福利：⼀个策略组对应的回报的总合。
社会最优：两个人策略收益相加为最大。
社会最优和纳什均衡可能一致。从社会应用的意义上讲，纳什均衡和社会最优一致的系统是理想系统。

第八章（博弈论应用）、布雷斯悖论，人数要会算，书上有几道课后题可以参考。匹配清仓价格要会算，次价拍卖鼓励真实出价的证明

布雷斯悖论，人数要会算，书上有几道课后题可以参考

公路交通网

假设有4000辆车，如果同时走A-C或者D-B则所需时间为40+45=85分钟，如果一半司机走A-C-B，一半司机走A-D-B则时间为20+45=65，为纳什均衡

2.布雷斯悖论

多修了一条路可能情况会更糟，在追求个人利益最大化动机的驱使下，解决社会问题不能仅靠增加资源，还要注意调整结构均衡状态下，每个司机的纳什均衡策略都是A-C-D-B，40+40=80>65，增加了一条路情况反倒变得更糟

3.提高效率的办法

或者收费

###

次价拍卖鼓励真实出价的证明

拍卖（1）英式拍卖——增价拍卖买方不断出价（提高售价），部分买方逐渐退出，直至剩下一个买方，以当前价格获得商品（2）荷兰式拍卖——降价拍卖卖方从最高价逐渐降价，直至有第一个买方接受当前价格，获得商品（3）首价密封拍卖买方同时向卖方提交密封报价，出价最高者以其出价获得商品（4）次价密封拍卖买方同时向卖方提交密封报价，出价最高者以次价获得商品

###

考虑次价密封拍卖问题次价拍卖鼓励人们说真话，我出价的占优策略即是真实估价，如果我拿到购买权，我会以低于我出价的价格购买商品，赚；如果我没拿到购买权，如果此时我想拿到购买权，需要出价比第一人高，这超乎我对商品的估价，收益为负。因此，出真实估价是占优策略。

匹配清仓价格要会算

匹配问题——形成社会最优基于二分图，左侧节点表示一类资源，右侧节点表示另一类资源当二分图两边有数目相同的节点，一个完美匹配就是左右节点的配对，使得每个节点都有边连接到另一边节点且不会出现左边两个节点同时连接到右边同一个节点

引入估值和价格

我们发现对于买方y，商品abc带来的收益相等对x,a带来收益最大.....对a这就存在一种竞争。

可以通过调整价格来实现最优匹配（市场清仓价格），经济学术语为社会最优推广：

一样可以通过调整价格来实现和最大——被竞争商品加价

第九章(广告)、VCG和GSP价格要会算

VCG和GSP价格要会算

###

广告如何定价——互联网公司给出每个广告位的点击率，供广告主估计广告位价值=点击率 × 单次点击估值

价格从0、0、0开始加价形成完美匹配

GSP：单品次价拍卖机制的一种自然推广

我们已经证明，在单品次价拍卖中，竞拍者没有动机让v和b不一样。在单品次价拍卖中，竞拍者没有动机让v和b不一样。与单品次价拍卖中不同的是，在单品次价拍卖中，每个人的占优策略都是按照自己的估值出价，但是在GSP中可能出现

VCG——为了保持次价拍卖的优良性质

第十章（权利）、稳定结果，平衡结果，纳什议价解，判断谁更有权力

1.社交网络中的权力——一个节点具有权力是因为，其他节点对其具有依附性，它具有排他性，饱和性，中心性反映在图上：B之所以具有权力，是因为依赖性：对于A和C而言，这种价值的来源完全在于B 排他性：B有能力排除A和C 饱和性：B比群体中其它成员能获得更多的价值，而一旦饱和之后，B维持这些社会关系的兴趣会降低，它倾向于不满足从一个关系中得到于对方均等的价值份额介数（中心性）：B有高介数，B是网络中多个节点对之间唯一的途径点

稳定结果

1.给定一个图，”结果“是其中的一个匹配（一个点无冲突的边的子集）

2.结果的稳定与不稳定不稳定：存在一条不在结果中的边，其两端的价值之和小于1 稳定：不存在不稳定的边

3.不稳定因素：不在结果中的一条边，其两端点的价值之和小于1，则次边为不稳定边。

4.稳定结果：不在结果中的所有边，其两端点的价值之和大于等于1。

纳什议价解

两人交互模型——纳什议价解

假设A，B两人谈判分配1元钱，但A，B各有一个外部选项x和y

对于x，y的关系有如下两种

（1）x+y<=1 这种情况下，A和B才会有可能达成协议，因为，她们都有可能拿到比x（y）更大的收益，如果两人具有同等地位的谈判权力时，即表示两人同意平分剩余的s=1-x-y 则对A来说为x+ s/2 则对B来说为y+ s/2 为纳什议价解（2）x+y>1 这种请况，谈个毛线

谁更有权利

平衡结果

稳定结果:不在结果匹配中的边，两端节点的赋值之和不小于1。

平衡结果:在结果匹配中的边，两端节点的赋值满足纳什议价解

两人交互模型——最后通牒同样A和B两人分一元钱，A（通常为具有更高谈判权力的人）提出一个方案，多少给B，剩下归自己；B选择接受或拒绝；如果B接受，拿到收益，如果B拒绝，两人均拿不到钱如果B是一个完全理性人，那么不管A提出什么样的方案，都会接受（有总比没有好）实际情况，A不会给B很少很少的收益，相对那种极端情况会很温和，”金钱至上“不是人类的典型行为结论：现实中出现 1/6和 5/6类似的分配关系就可以认为达到了理论极端情况
网络交换实验——稳定结果同样，稳定和不稳定与上文所述概念类似，没有一个节点可以向没和自己达成协议的相邻节点提出一种比现有收益更大的建议即为稳定
网络交换实验——平衡结果平衡结果：给定网络其余部分为每个节点提供的最好外部选项，一个交换结果称为平衡的条件是，对匹配的每条边来说，价值的划分体现了两个节点的纳什议价结果

ac不是平衡结果

证明:平衡结果一定是稳定结果。

答：平衡结果⼀定是稳定结果，但是稳定结果不⼀定是平衡结果。因为在⼀个平衡的结果中，匹配中的每个节点⾄少得到它的最好的外部选项，因此不存在两个节点有积极性来通过利⽤⼀条当前未⽤的边来破坏⼀个平衡结果。

第十一章（从众和流行）、贝叶斯计算即可，鹿还给出个一个中间有人告诉下一个人球颜色的例子，要会分析求解

贝叶斯计算

###

信息级联——当人们放弃了自己的想法与认同别人的看法时，我们认为发生了群集或信息级联
经典问题——判断蓝多罐或红多罐实验

计算过程主要运用贝叶斯公式，我们计算当前学生在拿到蓝（红)球以及知道之前学生拿到的球的颜色的条件下蓝多罐的条件概率

对于第三个学生而言，即便他抓到了红球，也会说是蓝多罐，即发生了信息级联
有的时候我们需要避免错误的信息级联

n趋于无穷时候，一定会形成信息级联的原因：

（了解）幂律——人们发现，拥有k个链入数的网页占比近似地与1/k^2成正比

幂率分布的特点：极端不均匀性（度跨度很⼤）、标度不变性。

什么导致幂律分布：增长性和择优性是产生幂律分布的一种机制，以及许多不同的过程和作用也会导致幂律分布

1、业绩来自哪里，头还是尾2、推荐的能力3、流行度可以变化

长尾理论的核心观点在于：

传统市场的销售主要集中在少数热门商品上，这些商品的销量高，但种类相对较少。
长尾市场则不同，它指出即使销量较低的产品，由于种类繁多，它们累积起来的总销量和利润可以匹敌甚至超过那些畅销品。
“⻓尾”理论：销量很⾼，但书的种类远远低于平均值的书，反⽽盈利更⼤，它存在于幂率的⻓尾之中。

第十二章（新事物扩散）、聚簇级联，平均延时时间要会算，判断是否行动

聚簇级联，平均延时时间要会算，判断是否行动

###

一种经典模型

对网络中的每一条边都转化成一种博弈

对某一确定的节点v，周围有d个邻居，其有占比p的邻居选A，1-p的邻居选B 如何在A和B两种事物之间进行选择？

聚簇——同质性往往可能成为新事物扩散的障碍，新的事物很难从外部进入紧密联系的团体中

密度：计算聚簇中的每个节点，其朋友出现在一个聚簇中的比例；聚簇的密度为这个比例的最小值比如上图中，a、b、c、d构成一个聚簇，其中a、b、c的比例都是1，而d的比例是 2/3 ，所以该聚簇的密度为 2/3

级联定理——描述聚簇和级联的关系 q为改用门槛密度》1-q的聚簇不能形成级联）

A向B扩散，则q=b/(a+b) 级联定理的简要证明

###

（知道怎么除就行）平均延时时间要会算

判断是否行动

共同知识的意义：

共同知识是了解邻居行动的重要基础
一个社会体系实际上是一个共同知识体系
共同知识构建了对他人行动预期的依据，尤其是在相对稳定的结构化社会网络中，共同知识可以成为默认的行为准则
但当不存在共同知识的时候，宣传就会发挥建构共同知识的作用（是最直接，最有效的手段）

邻居有人比自己低，就敢发起（有人比你更不满意现状）

第十三章（信息不对称）、赛马问题和柠檬市场，要理解

（了解）赛马问题，赔付率，效用函数

###

1.制度追求与个人追求的博弈个人——一般会在制度下追求自身利益的最大化（我们所讨论的都是“冷血”的理性人，不考虑那些少数利他主义者，我承认是我格局小了）制度的设计者——希望达到某种全局最优，不希望有个人逐利情况而破坏制度

2.外生事件和内生事件；外生事件市场和内生事件市场外生事件——该事件如何发生与人们的行为情况无关内生事件——该事件如何发生直接取决于人们的行动情况外生事件市场——事件发生的概率不受行动者参与的行为影响，比如：彩票（无论多少人去购买彩票，彩票中奖的概率不变），选举（无论多少人投票都会有一个人当选）内生事件市场——事件发生的概率受到行动者参与的行为影响，比如：二手车市场（如果人们相信二手车市场的车质量很好，就会倾向于出高价，这样就会促使二手车市场真的有高质量车出卖，车主也就会愿意把自己质量不错的车卖到二手车市场；反之，如果人们不相信二手车市场有好车，那么出价就低，低价就导致车主不愿意将自己的好车卖到二手车市场）市场成交与否，在于双方是否达成成交协议，但错误的估值或者信息之间的不对称（信息差）导致原本可以存在的议价空间over

3.赛马问题——外生事件市场线性效⽤函数：谁的赔率高就全买谁。

![img](https://cdn.jsdelivr.net/gh/jianlubuzoulucky/ImageBed/imageBed/typore/202406212049607.png