任务5:作者信息关联

该博客介绍了如何进行作者关联的数据建模任务,包括构建论文作者关系图,统计作者间的联系,以及使用图算法进行社交网络分析。通过无向图、图统计指标如度、迪杰斯特拉算法等,挖掘作者之间的关系。最后,展示了具体的代码操作步骤。
摘要由CSDN通过智能技术生成

任务5:作者信息关联

5.1 任务说明

  • 学习主题:作者关联(数据建模任务),对论⽂文作者关系进行建模,统计最常出现的作者关系;
  • 学习内容:构建作者关系图,挖掘作者关系;
  • 学习成果:论文作者知识图谱、图关系挖掘。

5.2 数据处理理步骤
将作者列列表进行处理理,并完成统计。具体步骤如下:

  • 将论文第一作者与其他作者(论文非第一作者)构建图;
  • 使用图算法统计图中作者与其他作者的联系;

5.3 社交网络分析

图是复杂网络研究中的一个重要概念。Graph是用点和线来刻画离散事物集合中的每对事物间以某种方式相联系的数学模型。Graph在现实世界中随处可见,如交通运输图、旅游图、流程图等。利利用图可以 描述现实生活中的许多事物,如用点可以表示交叉口,点之间的连线表示路路径,这样就可以轻⽽而易易举的 描绘出一个交通运输网络。

5.3.1 图类型

  • 无向图,忽略略了了两节点间边的方向。
  • 指有向图,考虑了了边的有向性。
  • 多重无向图,即两个结点之间的边数多于一条,又允许顶点通过同一条边和自己关联。

5.3.2 图统计指标

  • 度:是指和该节点相关联的边的条数,⼜又称关联度。对于有向图,节点的入度 是指进入该节点的边的条数;节点的出度是指从该节点出发的边的条数;
  • 迪杰斯特拉路路径:.从一个源点到其它各点的最短路路径,可使用迪杰斯特拉算法来求最短路路径;
  • 连通图:在一个无向图 G中,若从顶点i到顶点j有路路径相连,则称i和j是连通的。如果 G 是有向图,那么连接i和j的路路径中所有的边都必须同向。如果图中任意两点都是连通的,那么图被称作连 通图。如果此图是有向图,则称为强连通图。

对于其他图算法,可以在networkx和igraph两个库中找到。

5.4 具体代码操作

1.导入所需包

import seaborn as sns           #用于画图
from bs4 import BeautifulSoup   #用于爬取arxiv的数据
import re                       #用于正则表达式,匹配字符串的模式
import requests                 #用于网络连接,发送网络请求,使用域名获取对应信息
import json               
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值