CCM交叉社区挖掘的初识认识

《An introduction to the special issue on cross-community mining》这篇文章主要讲述了CCM领域包含的4大方面,并列举该领域中存在的六大问题和解决方案。我想先就CCM的4大方面(属性关联(propertyassociation)、数据融合(data aggregation)、知识转移(knowledge transfer)、交叉社区网络数据的传播与促进作用(Informationdissemination and forwarding))谈谈自己对本文的理解。

现在,人们生活在多种多样的社交圈子里,这种圈子可以是现实社会中稳定的强关联关系;也可以是虚拟世界中基于某一共同的兴趣爱好而形成的微关联或弱关联关系。强关联关系能直接影响人的行为动作及需求,但弱关联关系也可通过人在不同社区中的特点,来挖掘用户潜在的特征,从而分析出用户需求。尽管,线上线下间用户的社交圈子会不同,但形成社交网络圈子中的人是有特定行为特点的,property association即是通过用户间所具备的某一共同属性关联起整个社交圈子。

顿巴数理论指出人类拥有的稳定的社交网络人数大概是150人左右。但不稳定的微关联关系却不止150人。而用户本身的多样性往往体现在这种不稳定的关系里。因为现在的社交网络种类之多会使绝大多数人选择在不同的社交圈子里扮演不同的角色,或许他在新浪微博里是个网络红人,但在豆瓣上却不那么受欢迎;又或者在论坛里他是一个IT达人,但在贴吧里他是一个烹饪达人。当然这种圈子可能很不稳定,但其用户特点却是我们想去获取的。因此,我理解的Knowledge transfer便是:利用用户在某一社交网络中的数据推断出用户在另一社交网络中的行为。设想,我们在新浪微博里关注了许多Data Mining 领域的大牛,当我们去卓越网买书时,若是系统推荐DataMining的书是不是会刺激我们去购买呢?

怎样将复杂社区之间的数据融合在一起?这便是Data aggregation所解决的问题。我们知道网络之间也存在关系,包括:依存关系,合作关系,交叉关系。正是网络中的这种交叉关系,才使得网络中的数据可以融合。如果我们能判断不同的社交网络中存在的某些节点是同一个人A,那便可以将A在不同社交网络上的数据整合起来,再为A设计一个适合其自身特点的分类器,优化出一个预测模型,这一过程,我认为是Dataaggregation。就像文章第三节指出的第一个问题“基于社区相似度网络的大规模行为识别”,它的解决方法是:在有相似性特征的社交网络(CSN)中,每个用户都有一个独一无二的分类器,CSN利用源自人群的传感器数据,借助来自其他类似用户的数据,对分类器加以个性化识别。这样做的好处是即使用户数量庞大,特点多种多样,也能基于某一属性筛选出相似用户。

又或者,像Foursquare这种基于位置的社交网络,充分利用Cross-communityinformation dissemination and forwarding这一特点,利用在线社区与机会主义的优点来增加信息的扩散,从而达到其商业目的。文章第三节第五个问题指出:我们该如何发现附近用户的社交机会。用户自发性的推荐某一地点更容易被我们接受。利用中间件提供的功能,用户可以自发性的在某一地方签到,并通过property association来发现附近的相似用户。这种划分不同于普通社交网络基于用户的某一爱好等进行分类,而是从不同的社会角度或者商业角度考虑,它并没有显性的将用户分类,但是可以通过用户自发性推荐的这种交互行为产生的对某一地点的描述,给该地点的商家提供了商业机遇。并且,也使得共同定位该地点的用户更容易形成社交圈子。大众点评就是抓住用户自发性的签到提供的商业机会,得到了商家和用户的信任。

未来社会,我们期望的是所有的移动设备都可以通过云计算、广域wifi等整合在一起,使这些设备都有筛选信息的能力。普适计算的特点就是人们在任何时间地点环境下可以通过任何方式进行信息的获取或处理。文章第三节最后一个问题指出:我们应该对跨社区的上下文管理机制进行创新。例如我们可以利用上下文相似性开发基于上下文的社区,这种社区支持上下文继承其他社区的成员。这种框架会使复杂的社区网络间的信息的交互变得更加高效。

当然,我们也可以利用CCM技术的地理特征获取用户线上线下的社交关系。Twitter就是抓住了这一机遇,对社交网络中的地理位置效应进行分析和度量。Twitter分析了用户、用户间的关系、用户信息的流动这三种属性,发现大多数用户的社交圈子都是同一国家不同的几个城市。这更能说明物理世界中的社会关系在虚拟的网络社会中是可以获取的,并且能应用于复杂社区间信息的挖掘。


 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值