Detecting Topic Authoritative Social Media Users: a Multilayer Network Approach

Detecting Topic Authoritative Social Media Users: a Multilayer Network Approach
https://booksc.xyz/book/68131649/87286e
本文的背景是在希望社交网络中找到大V。

Abstract

在过去几年中社交媒体和微博网站的迅速普及之后,识别具有影响其他用户选择能力的用户是一项重要的研究课题,因为它可以为许多商业公司提供机会。但是,大多数现有方法都是通过依靠在连接具有不同类型相互关系的用户的网络上计算的中心性度量来检测影响者的。在本文中,我们提出了一种能够利用三层网络对这些用户的内容进行建模的方法,该方法通过利用他们发布的消息的内容来表达对项目的意见,从而找到有影响力的用户。层代表用户,项目和关键字,以及同一层的参与者之间的层内交互。**层间连接是三元组(u,i,k),表示用户 u 使用关键字 k 对项目 i 进行评论的信息。**通过利用多线性代数,我们提出了一种能够提取最活跃的用户的方法,该用户陈述了他们关于用显性关键字标记的显性项目的观点。我们对从Twitter和Yelp社交网络收集的有关不同主题的不同现实世界数据集进行了一系列实验。实验结果表明,我们的方法能够找到既有影响力的用户,又权威的用户,这些用户既在用户网络中具有权威性,又在发布有关感兴趣主题的意见方面非常活跃。

1 Introduction

近年来,社交媒体和微博网站的普及使人们有机会轻松地与其他用户交流并以多种格式共享信息,例如消息,评论,照片,视频。越来越多的社交用户喜欢通过发布有关兴趣论点的心情和评论并公开其人际关系来与世界各地的其他用户分享他们的经验。在Twitter,Facebook,Flickr,Epinions,Yelp等各种社交网络平台上发布的大量数字化信息吸引了研究界和商业公司的兴趣,因为它可用于预测和分析社交行为[1],[2 ],[3],从而在包括病毒式营销和推荐系统在内的许多实际应用中提供了商机,以最大化公司收入。实际上,通过分析人们对这些论点表达的观点和态度来了解主题或产品突然流行的动机,可以为设计更有效的促销活动提供宝贵的帮助。

在这种情况下,一项至关重要的研究活动是确定具有影响其他用户选择能力的用户。但是,确定有影响力的用户的特性并不是一件容易的事,并且已经在市场营销和社会学等许多领域进行了广泛的研究。在过去的几年中,通过分析可以通过允许用户使用的行为建立的社交联系,人们对研究社交媒体中的影响者投入了大量注意力。例如,Yelp允许建立朋友社区,并就不同的活动或地点交换意见。在Twitter中,用户通过关注发布有趣消息的人进行交互。用户 u 可以通过转发其他用户的帖子来向其关注者发送信息。此外,用户可以通过在推文中添加用户名来提及其他用户。如[4]中所述:
用户u的关注者数量表示u受欢迎程度的指标,并且被视为影响程度的度量,即 indegree influence.。
转推的数量代之以衡量用户生成广播给其他用户的信息的能力,即 retweet influence。
被 @ 的次数(即mention influence)代表用户的名称值,并衡量该用户在主题讨论中吸引其他用户的能力。
. Cha et al. [4] 观察到单独的 indegree influence 单独时不一定生效,因此metion和转发的影响值得进一步研究。
现有的寻找有影响力的用户的方法主要依靠基于集中度(centrality)指标的度量,这些度量是在代表人际关系的网络上计算的[5]。 例如,PageRank [6]将 hub 节点视为重要用户,而HITS [7] 除了 hub 得分外,还引入了 authority 得分。 基于这些概念可以延伸出很多方法。 但是,他们既不考虑用户的兴趣_(我理解就是领域)。_
在本文中,我们提出了一种称为social media authority user(SocialAU)的方法,用于检测发送
特定主题
帖子的有影响力的用户。 该方法从用户文本消息中提取信息,这些消息可以是推文,帖子,评论,与所选主题相关的项目以及用于表达对这些项目的意见的关键字,并使用三层网络对该信息进行建模。 层代表用户,项目和关键字,以及同一层的参与者之间的层内交互。 此外,层间交互表示为三元组(u,i,k),其含义是用户 u 通过使用关键字 k 表达对项目 i 的意见。 虽然每层的网络都可以用对应图的传统邻接矩阵表示,但层间连接却是用三阶张量建模的[8]。

其中:

  • ITEM,即主题的实例(例如“机器人先生”,“行尸走肉”,“大爆炸理论”),
  • KEYWORD,用于谈论项目和表达意见的关键字,以及
  • USER,项目和关键字之间的层内和层间连接,例如:项目之间的相似性,关键字的共现以及用户之间的关系(例如评论,转发,专注)。

图1(b)显示了一个三层网络的示例,该网络由10个Twitter用户通过使用8个关键字发布的关于4个项目的帖子构成。 弧的粗细与两个节点之间的连接数量成正比。 例如,USERS层中的用户u7和用户u8之间的联系意味着u7多次提及u8或转发了她的帖子,而边(k5,k7)意味着这两个单词出现在同一条推文中。 三元组(u7,i1,k1)表示用户 u7 在项目 i1 上发送了几条包含关键字k1的推文(注意弧的粗细)。

为了检测有影响力的用户,SocialAU扩展了Kolda等人介绍的TOPHITS技术。 与TOPHITS相似,它采用贪婪的PARAFAC程序来获取三层网络的 authoruty 和 hub 分数。但是,和 TOPHITS 有两个主要区别。 首先是SocialAU使用多层网络,而TOPHITS使用多路复用(也称为多维)网络[10],这是多层网络的一种特殊情况。此外,SocialAU修改了PARAFAC贪婪算法,以 HITS 算法在每一层上计算出的分数[7]。 实际上,我们的方法在计算三层网络的主导用户时利用了相对于单层用户网络的中心和权限得分,并在计算三层网络的主导关键词时利用了相对于关键字网络的权限得分层网络。 这些修改的分数使用户不仅可以在有关所选主题的项目上发送大量帖子,还可以在自己的网络中获得权威。

表I突出显示了SocialAU和TOPHIT S对图1的多层网络所获得的得分。通过按降序对它们进行排序,可以看到这两种方法如何确定每个用户的权威性。 请注意,用户u8在USERS网络中有许多传入边缘,而u7仅具有传出边缘,因此尽管u7和u8都对不同的项目表达了几种意见,但由于收到了很多提及或转推,因此,SocialAU认为u8比u7更有影响力 。

2 Relation Work

3 PRELIMINARIES

4 HIGH ORDER ANALYSIS

首先简单的介绍了下HITS算法,下面是这一组耳熟能详的公式:

表述为矩阵形式就是:

可以证明,在适当条件下,向量 a 收敛于 ATA 的特征向量, 向量 h 收敛于 AAT 的特征向量。然后,矩阵 A 是可以用 SVD 化简到低秩的。

上图表示前p个u和v的外积。所以有:

TOPHITS方法[9]是HITS方法的概括,它在超链接结构中添加了第三维。 它构建了网页的语义图,其中边用链接的锚文本标记。 因此,它生成了三重集合(hi; ai; wi),其中h和a是网页的中心和权威分数,而w包含术语的主题分数。 这些分数类似于HITS,可以迭代计算为:

5 METHODOLOGY

在本节中,我们提出一个模型来表示用户在选定主题上发布到Web上的信息,目的是检测最具影响力的用户。该模型这里是用于Twitterposts的, 但是,它可以用于从社交媒体提取的任何类型的文本消息。固定一个主题,从处理该主题的消息集中,我们构建了一个三层网络。 这三层分别表示:用户、项目和关键字。层内交互建模同一层的参与者之间的连接类型,而层间交互则提供信息,用户u使用 关键字k。
假设,令n,m和r分别为用户数,标签数和keyword数。整个需要的数据结构是两部分:
第一部分是三张有向图,Gu,Gi,Gk。Gu 表示用户图,边可以是用户之间的关系,比如关注关系;Gi 我理解是实体图,比如微博上的标签,类似 “#复仇者联盟”,“#李小璐出轨”,这种,边是相似的标签之间存在边,这部分操作余地比较大;Gk是keyword图,推文中两个词共现即对应一条边。
第二部分是一个三阶的矩阵,表示“层间关系”,具体来说就是一个nmr的共现矩阵,表示user在某个标签下发表了带有某个关键字的doc。矩阵中的元素可以是简单的计数,也可以应用我们常见的归一化手段。

可以结合使用HITS和TOPHITS中引入的概念,以找到最权威的用户。 Kleinberg引入的对网页评分的authority 和 hub 的定义[7]可以通过用用户的概念代替网页的概念来适应用户为节点的场景。 因此,如果用户u1链接到用户u2,则认为u1传递了权威性到u2。 实际上,如果用户u1提及另一个用户u2或转发了u2的推文,那么她就认为u2发出的内容有趣。 如果用户u1链接到许多权威用户,则称她为hub。 好的hub是指向许多好的authority的用户。 良好的authority是由许多良好的hub指向的用户。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值