![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析之学术前沿分析
文章平均质量分 80
尽力而为还不够
这个作者很懒,什么都没留下…
展开
-
数据分析之学术前沿-任务五
任务说明 学习主题:作者关联(数据建模任务),对论⽂作者关系进⾏建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系 学习成果:论⽂作者知识图谱、图关系挖掘 数据处理步骤 将作者列表进⾏处理,并完成统计。具体步骤如下: 将论⽂第⼀作者与其他作者(论⽂⾮第⼀作者)构建图; 使⽤图算法统计图中作者与其他作者的联系; 社交网络分析 图是复杂⽹络研究中的⼀个重要概念。 Graph是⽤点和线来刻画离散事物集合中的每对事物间以某种⽅ 式相联系的数学模型。 Graph在现实世界中随处可⻅,如交通原创 2021-01-26 01:22:29 · 198 阅读 · 1 评论 -
数据分析之学术前沿---任务4
import seaborn as sns #⽤于画图 from bs4 import BeautifulSoup #⽤于爬取arxiv的数据 import re #⽤于正则表达式,匹配字符串的模式 import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息 import json #读取数据,我们的数据为json格式的 import pandas as pd #数据处理,数据分析 import matplotlib.pyplot as plt #画图⼯具 data = [] #初原创 2021-01-23 01:32:42 · 236 阅读 · 1 评论 -
任务3:论⽂文代码统计
任务3:论⽂文代码统计 3.1 任务说明3.2 数据处理理步骤3.3 正则表达式3.3.1 普通字符:大写和小写字母、所有数字、所有标点符号和一些其他符号3.3.2 特殊字符:有特殊含义的字符3.3.3 限定符3.4 具体代码实现以及讲解 3.1 任务说明 任务主题:论文代码统计,统计所有论文出现代码的相关统计; 任务内容:使用正则表达式统计代码连接、页数和图表数据; 任务成果:学习正则表达式统计; 3.2 数据处理理步骤 在原始arxiv数据集中作者经常会在论文的comments 或abstrac原创 2021-01-20 01:53:32 · 123 阅读 · 0 评论 -
数据分析之学术前沿分析- 任务2
任务2:论⽂文作者统计 2.1 任务说明2.2 数据处理理步骤2.3 字符串串处理理2.4 具体代码实现以及讲解2.4.1 数据读取2.4.2 数据统计 2.1 任务说明 任务主题:论⽂文作者统计,统计所有论⽂文作者出现频率Top10的姓名; 任务内容:论⽂文作者的统计、使⽤用 Pandas 读取数据并使⽤用字符串操作; 任务成果:学习 Pandas 的字符串串操作; 2.2 数据处理理步骤 在原始arxiv数据集中论⽂文作者authors 字段是⼀个字符串格式,其中每个作者使用逗号进行分隔,所 以我们原创 2021-01-17 00:15:22 · 718 阅读 · 0 评论