![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 62
zln不会敲代码
这个作者很懒,什么都没留下…
展开
-
【寒假组队】数据分析-task02学术前沿趋势分析
学习笔记—学术前沿趋势分析 论文作者统计 任务主题:论文作者统计,统计所有论文作者出现频率Top10的姓名; 任务内容:论文作者的统计、使用Pandas读取数据并使用字符串操作 任务目标:学习Pandas的字符串操作 数据处理步骤 在原始arxiv数据集中论文作者authors字段是一个字符串模式,其中每个作者使用逗号进行分割,所以首先需要用逗号对作者进行切分,再剔除单个作者中非常规的字符。 数据读取 # 导入所需的package import seaborn as sns #用于画图 from bs4 i原创 2021-01-16 22:13:20 · 83 阅读 · 1 评论 -
【寒假组队】数据分析-task01 论文数据统计
任务1:论文数据统计 任务说明:统计2019年全年计算机各个方向的论文数量; 1.数据集准备 数据集来源数据集下载地址 数据集说明 2.格式说明: id:arXiv ID,可用于访问论文; submitter:论文提交者; authors:论文作者; title:论文标题; comments:论文页数和图表等其他信息; journal-ref:论文发表的期刊的信息; doi:数字对象标识符,https://www.doi.org; report-no:报告编号; categories:论文在 arXiv 系原创 2021-01-13 19:33:44 · 207 阅读 · 1 评论