Efficient Algorithms for Public-Private Social Networks

KDD 2015 Best Research Paper Award: “Algorithms for Public-Private Social Networks”


ABSTRACT

the public graph is visible to everyone,and the private graph at each node is visible only to the user at the node. From each node’s viewpoint, the graph is just a union of its private graph and the public graph.

隐私问题决定了在社交网络的成员之间共享信息的方式。在最简单的情况下,用户可以将她的一些朋友标记为私人; 这将使得该用户和这些朋友之间的连接(边缘)仅对用户可见。在不同的隐私实例化中,用户可以是私人组的成员; 在这种情况下,组成员中的所有边缘被认为是私有的。

因此,社交网络中的每个用户具有她自己的网络的链路结构的视图。这些隐私问题还影响网络本身可以被算法查看和处理的方式。例如,不能使用用户X的私人朋友的列表来向网络上的另一用户建议潜在的朋友或公共新闻项目,但是可以使用该列表来为用户X建议朋友的目的。

顺便吐槽一下我的研究方向,什么social network,真是为自己的智商着急,看过的东西就忘。


INTRODUCTION

In fact, privacy controls the way information is shared among the members of the social network, and also influences the way in which the network itself can be viewed and processed by algorithms.

常见例子如:

  • user可以标记其中他的一些朋友为私密好友,这会使得user和私密朋友之间的关系(edges)仅仅被用户本身可见。
  • user可以成为私密group的成员,这样他们之间的关系会标记为privacy,group内的所有edges都视为第一种情况。

Thus, each user in the social network has her own view of the link structure of the network.

这个Public-Private 为什么这么重要呢,值得米帝大企业谷歌研究。根据美帝的一个paperFacebook users have become much more private

中国有没有这类Public-Private social network的东西呢? 在人人网没过气之前,还是有的吧。也许是因为咱们隐私意识比较强吧。Wechat ,QQ属于纯Private social network

social network providers can, naively speaking, run the algorithm once for each user, on the union of the public portion of the network and the user’s private network.

理想化的情况下,我们应当为每个人,利用其public information 和privacyportion 的并(union),来运行推荐算法。但效率上讲,这样做是不是实际的。

Sketching

本文先做出了一些假设前提:

  • Gu 内的点 v 最多离u 2跳;
  • 算法有效即:计算 GGu 的时间复杂度与 Gu 的规模成比例
  • Sketching algorithms仅考虑基本图问题如连接性,不考虑比如neighborhood estimation and reachability

Sampling

本文算法有个不平凡(non-trivial)的算法,解决了三个关键性问题:
- estimating all-pair distances
- estimating node (pairwise) similarities
- correlation clustering(关联聚类,Machine-Learning?)

对于前两个,论文使用了sampling-based algorithms that are efficient in the public-private model。最后那个update a clustering solution on the public graph using the edges in the private graph.

Public-Private GRAPHS

G=(V,E) 中,我们定义 n=|V| m=|E|

Proposition 1. We can count the number of connected components in the public-private model using preprocessing time O(m) and space O(nlogn) and query time |Eu| .

计算出public-private图的连接组件。然后我们分配一个组件 每个节点标识符和存储这些信息;

SKETCHING ALGORITHMS

botto,-k sketch

假设任意 V 的子集V,即 VV 。规模估计过程为:

  • V 中的点 v r(v)U[a,b] r(V) 表示一组 r(v)

  • 假定 r(V)>k ,令 Botk(V) 表示 r(V) 中k小的元素, Botk(V)r(V)

  • bk(V)=maxBotk(V)

V 的规模可由如下表达式写出:

|V|={|Botk(V)|,(k1)/bk(V),if |Bot_k(V')| < kotherwise

大致思路是,集合规模越大,最后求出的 r(V) 越多。因为 r(V) 是随机产生的,因此 Botk(V) 取到的k小个元素会越小,因此其最大值也会降低。

最终通过分母反馈回 V 的规模。这个地方数学推到应该不难,预知更多见E. Cohen and H. Kaplan. Summarizing data using bottom-k sketches. In PODC, pages 225–234, 2007.

A nice property of this sketch is that it is composable;this is crucial in estimating the size of the reachability tree


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
未来社区的建设背景和需求分析指出,随着智能经济、大数据、人工智能、物联网、区块链、云计算等技术的发展,社区服务正朝着数字化、智能化转型。社区服务渠道由分散向统一融合转变,服务内容由通用庞杂向个性化、服务导向转变。未来社区将构建数字化生态,实现数据在线、组织在线、服务在线、产品智能和决策智能,赋能企业创新,同时注重人才培养和科研平台建设。 规划设计方面,未来社区将基于居民需求,打造以服务为中心的社区管理模式。通过统一的服务平台和应用,实现服务内容的整合和优化,提供灵活多样的服务方式,如推送式、订阅式、热点式等。社区将构建数据与应用的良性循环,提高服务效率,同时注重生态优美、绿色低碳、社会和谐,以实现幸福民生和产业发展。 建设运营上,未来社区强调科学规划、以人为本,创新引领、重点突破,统筹推进、整体提升。通过实施院落+社团自治工程,转变政府职能,深化社区自治法制化、信息化,解决社区治理中的重点问题。目标是培养有活力的社会组织,提高社区居民参与度和满意度,实现社区治理服务的制度机制创新。 未来社区的数字化解决方案包括信息发布系统、服务系统和管理系统。信息发布系统涵盖公共服务类和社会化服务类信息,提供政策宣传、家政服务、健康医疗咨询等功能。服务系统功能需求包括办事指南、公共服务、社区工作参与互动等,旨在提高社区服务能力。管理系统功能需求则涉及院落管理、社团管理、社工队伍管理等,以实现社区治理的现代化。 最后,未来社区建设注重整合政府、社会组织、企业等多方资源,以提高社区服务的效率和质量。通过建立社区管理服务综合信息平台,提供社区公共服务、社区社会组织管理服务和社区便民服务,实现管理精简、高效、透明,服务快速、便捷。同时,通过培育和发展社区协会、社团等组织,激发社会化组织活力,为居民提供综合性的咨询和服务,促进社区的和谐发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值