二部图最大权匹配_学习记录 二分图匹配问题与匈牙利算法及KM算法

本文介绍了二分图最大权匹配问题,特别是在社交数据实时事件检测中的应用。首先解释了如何使用Louvain方法进行聚类,然后通过最大权匹配算法(如匈牙利算法和KM算法)进行聚类链接。二分图匹配涉及匹配点、最大匹配和完美匹配的概念。接着详细阐述了匈牙利算法,包括增广路和其在求解最大匹配中的作用。最后讨论了KM算法,它是求解最大权完备匹配的方法,并探讨了算法的优化和应用场景。
摘要由CSDN通过智能技术生成

一、前言


在论文“Real-time Event Detection on Social Data Streams”中,作者首先在每一个时间窗口(分钟级)内利用社区发现算法(Louvain method)得到一个聚类  ,然后采用带权二分图最大匹配(maximum weighted bipartite matching)对  和上一时间窗口的聚类  进行聚类链接(Cluster Linking)。

We filter out any edges whose weight falls below a threshold and perform maximum weighted bipartite matching to find cluster links.

论文将节点之前的权重定义为:  与  各节点间共有的实体数目。

The edge weight between them is a measure of how many entities these clusters share, similar to the cosine similarity described earlier.

4586145e773c089e6bb208f50b0f6ef1.gif

背景交代完,接下来我们就开始补充二分图匹配问题、匈牙利算法和KM算法的相关知识。

二、二分图匹配问题


所谓二分图(Bipartite Graph)就是这样一个图:

124b6b936d3283cba4da84b651f5c361.png

简单地说,就是一张图里的所有点可以分为两组(如上图),并且每条边都跨越两组。这样的图就是二分图。

1. 二分图的定义

说的严谨一点:

二分图又称双分图、二部图、偶图,指顶点可以分成两个不相交的集U和V(U和V皆为独立集(Independent Sets)),使得在同一个集内的顶点不相邻(没有共同边)的图。

一个图为二分图仅当:

  • 没有奇数圈;

  • 点色数为2;

2. 相关的几个概念

5e36021eacf0c9ed02525d62a6856bdd.png5b6a9c5dbbeace785c46ff1bd63d1c5a.png583908017871b0cab6a7672578633b11.pngd79bf724ad911ed75889f6fd78aa8ce8.png

我们定义匹配点、匹配边、未匹配点、非匹配边。如图3,1、4、5、7为匹配点,其他顶点为未匹配点;1-5、4-7为匹配边、其他边为非匹配边。

  • 匹配(matching):二分图的一个“匹配”是指一些边的集合,任意两条边没有公共点。例如,图3、图4中红色的边就是图2的匹配。

  • 最大匹配(maximum matching):二分图的“最大匹配”,值的是二分图的所有匹配中边数最多的匹配。图4是一个最大匹配。它包

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值