DW-- 学术前言趋势分析(五)

本文利用arXiv公开的17万篇论文数据集,通过Python进行学术发展趋势分析,关注作者关联。介绍了无向图、有向图和多重无向图的概念,并探讨了度、迪杰斯特拉路径和连通图等图统计指标。数据处理中创建了作者链接的无向图,并选择了最大联通子图进行研究。
摘要由CSDN通过智能技术生成

一、学习内容链接:DataWhale - 学术前言-Github

arXiv 重要的学术公开⽹站,也是搜索、浏览和下载学术论⽂的重要⼯具。arXiv论⽂涵盖的范围⾮常 ⼴,涉及物理学的庞⼤分⽀和计算机科学的众多⼦学科,如数学、统计学、电⽓⼯程、定量⽣物学和经济学等等。

目的:将使⽤arXiv在公开的17万篇论⽂数据集,通过数据分析能够挖掘出最近学术的发展趋势和学术关键词。

使用工具:python

主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;

图类型
(1)无向图,忽略了两节点间边的方向。
(2)指有向图,考虑了边的有向性。
(3)多重无向图,即两个结点之间的边数多于一条,又允许顶点通过同一条边和自己关联。

图统计指标
(1)度:是指和该节点相关联的边的条数,又称关联度。对于有向图,节点的入度 是指进入该节点的边的条数;节点的出度是指从该节点出发的边的条数;
(2)迪杰斯特拉路径:.从一个源点到其它各点的最短路径,可使用迪杰斯特拉算法来求最短路径;
(3)连通图:在一个无向图 G 中,若从顶点i到顶点j有路径相连,则称i和j是连通的。如果 G 是有向图,那么连接i和j的路径中所有的边都必须同向。如果图

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值