Academic social networks: Modeling, analysis, mining and applications

期刊:Journal of Network and Computer Applications
作者:Xiangjie Kong, Yajie Shi, Shuo Yu, Jiaying Liu, Feng Xia ∗
单位:Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province, School of Software, Dalian University of Technology, Dalian, 116620,China


Abstract

在学术大数据快速发展的背景下,社交网络技术最近引起了学术界和行业的广泛关注。 学术社交网络的概念正是在学术大数据的背景下创建的,学术大数据是指由学术实体及其关系形成的复杂学术网络。 有很多学术上的大数据处理方法可以分析有关学术社交网络的丰富结构类型和相关信息。 如今,可以轻松获取各种学术数据,这使我们更易于分析和研究学术社交网络。 本研究调查了学术社交网络的背景,现状和趋势。 我们首先详细阐述学术社交网络的概念和相关研究背景。 其次,我们根据节点的类型和及时性来分析模型。 第三,我们回顾分析方法,包括相关指标,网络属性和可用的学术分析工具。 此外,我们还为学术社交网络挑选了一些关键的挖掘技术。 最后,我们从三个层面系统地回顾了该领域的代表性研究任务:参与者,关系和网络。 此外,还介绍了一些学术社交​​网站。 这份调查总结了当前的挑战和未解决的问题。

1. Introuction

如何从数百万的学术大数据中挖掘有价值的信息是一个紧迫的问题。
对SBD的深入分析不仅可以使研究人员更有效地利用可用资源,而且可以为学术界和工业的发展做出贡献。 但是,对此问题的系统研究不足。

2. Academic social networks

实际学术网络大多是异构网络,也是动态网络。
学术研究的主要方向:作者排名,作者兴趣发现,后起之秀发现,学术推荐和社区发现。

3. Academic social networks modeling

同质网络:合作网络,引用网络,共词网络。
在这里插入图片描述
异质网络:文章-作者网络,引用耦合网络,混合网络(引文—主题等)
在这里插入图片描述
我的想法:
选择同构还是异构网络,主要还是和我们的研究主题相关。
但是在现实研究中,我们所定义的同构网络可能隐藏异构信息,节点可能含有其他属性,边权也可能包含其他信息,这些属性在网络中会产生隐性或者显性的影响。所以,应该没有完全单纯的同质网络。

4. Academic social network analysis

Social network metrics

gobal metrics

  • diameter(直径):两点之间的最大路径
  • density(密度):网络的连接/网络最大连接
    在这里插入图片描述
  • average shortest path length(平均最短路径):任意两点的最短路径平均长度——联通
    在这里插入图片描述
  • harmonic average shortest path length(非联通):
    在这里插入图片描述
  • average degree(平均度):
    在这里插入图片描述

community metrics:可以识别整个网络中紧密互连的组

  • core(核):k-core——组中每个节点至少连接组内其他k个点。
  • clique(集团):最大的点集合,其中点与点之间直接相连。

node degree:某一个点的邻居节点
在这里插入图片描述
clustering coefficient

  • local clustering coefficient(局部聚类系数):一个点的邻居点/邻居点之间的可能连接数
    在这里插入图片描述
  • global clustering coefficient(全局聚类系数):
    在这里插入图片描述

centrality

  • degree centrality:度/最大度
    在这里插入图片描述
  • closeness centrality:点与其他所有点的最短路径的平均——倒数(0-1)
    在这里插入图片描述
  • betweenness centrality:
    中间性中心度用于描述到达其他节点必须经过的节点范围。
    在这里插入图片描述
    分子:从s到t经过i的最短路径数
    分母:从s到t的最短路径数
  • eigenvector centrality(特征向量中心性):
    在这里插入图片描述
  • pagerank:质量和数量
    在这里插入图片描述

Properties

常见网络的属性:
power-law degree distribution:幂律分布
大多数节点的度数都较低,很少有节点的度数较高
small-world property:小世界的属性在现实世界中比较普遍
mixing patterns:许多网络中的节点类型不同
community structure:社区结构

Academic social network analysis tools

在这里插入图片描述

5. Key mining technologies

挖掘学术网络中的相互关系:

  • Similarity measure
  • Statistical relational learning
  • Graph mining
  • Machine learning
    在这里插入图片描述

6. Applications

面向参与者,面向关系和面向网络
在这里插入图片描述

Actor_oriental applications

author-level tasks

  • author Name Disambiguation
    通过相关因素消除同名歧义,比如隶属关系,合作者关系等
  • author ranking
    迭代和非迭代:
    迭代:PageRank
    非迭代:h,g等
  • expert finding:寻找专业人员
    基于内容:测度相关文档和查询直接的相关性评估学者的专业知识
    基于学者的学术社交活动——合作,引用
  • rising star finding:强调潜在价值
    研究兴趣、度量指标等的动态变化

paper-level tasks

  • paper impact evaluation
    文章总引用,作者的h,期刊的IF
  • paper impact prediction
    社交媒体、引文分布,在传统的基础上加入新的维度

journal-level tasks

  • journal impact evaluation
    IF,高被引文章,集成指标等

Relationship-oriented application

  • author relationship prediction
  • academic recommendation
  • community/group detection

Network-oriented applications

  • collaboration pattern
  • interdisclplinary research
  • research trend prediction

7. Looking ahead

可以从以下方面开始对此主题的未来研究:
(1)建立异构的学术网络;
(2)建立统一的学术影响评估方式;
(3)整合多学科的学术数据资源;
(4)挖掘隐含指标以探索学术社交网络。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值