FRAUDAR: Bounding Graph Fraud in the Face of Camouflage 论文理解及算法解析

最新推荐文章于 2024-05-17 09:00:29 发布

置顶

轩辕森

最新推荐文章于 2024-05-17 09:00:29 发布

阅读量5.3k

点赞数 7

分类专栏：算法相关机器学习文章标签：算法社交网络挖掘 FRAUDAR KDD

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuanyuansen/article/details/60586961

版权

FRAUDAR是2016年KDD最佳论文，旨在识别伪装的虚假账户集群。它通过定义全局度量，构建优先树，移除二部图中的边，寻找最紧密的子网络。算法关键在于Column-weighting，以抵抗camouflage。虽然存在贪婪计算的局限，但能有效地检测dense子网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

FRAUDAR: Bounding Graph Fraud in the Face of Camouflage

1、一段话概括算法

FRAUDAR算法来源于2016年KDD会议，该论文获得了当年的最佳论文奖。该算法要解决的问题是找出站内最善于伪装的虚假账户簇。其原理是虚假账户会通过增加和正常用户的联系来进行伪装，而这些伪装（边）会形成一个很紧密的子网络，这样就可以通过定义一个全局的度量，再移除二部图结构中的边，使得剩余网络结构对应的度量的值最大，这样就找到了最紧密的子网络，而这个网络就是最可疑的。

2、论文主页

http://www.andrew.cmu.edu/user/bhooi/projects/fraudar/index.html

3、背景

在社交网络或者电商网站中，存在着用户关注其他用户或者用户浏览商品的二部图，其中的虚假用户会通过关注正常用户来伪装自己，而用户也会通过多浏览其它商品来伪装其真正要浏览的商品。更严重的情况是有一些正常的用户可能被盗，从而被利用来进行关注或者浏览等。在这样的情况下，虚假用户或者被盗用户与目标之间就会形成一个“dense”的子网络。算法的目的就是找到这样的子网络，从而完成虚假用户行为的识别。

4、计算过程

算法的核心计算过程可以简要描述如下，具体可以参考原论文中Algorithm1的伪代码：

a、建立优先树（一种用于快速移除图结构边的树结构）；
b、对于二部图中的任意节点，贪心地移除优先级最高（由优先树得到）的节点，直至整个网络结构为空；
c、比较上述每一步得到的子网络结构对应的全局的度量，取该值最大的子网络结构，那么该子网络结构就是最紧密的子网络，也就是最可疑的团伙。

其中最关键的地方是定义了一个全局度量，该Metric的定义是（目标度量），可以理解成子网络结构中每个点的平均可疑程度

g (s) = f ( s ) | s |

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。