自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 2021-01-19

【Task 03】论文代码统计今天有点别的事要做,所以先把代码和结果简略写一下了,只是跑了一遍。没有思考。(我错了)主要是第一次是用jupyterbook好不习惯啊啊啊# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import jso

2021-01-19 21:30:33 83

原创 2021-01-16

任务说明任务主题:论文作者统计,统计所有论文作者出现评率Top10的姓名; 任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作; 任务成果:学习 Pandas 的字符串操作;数据处理步骤与字符串处理在原始arxiv数据集中论文作者authors字段是一个字符串格式,其中每个作者使用逗号进行分隔分,所以我们我们首先需要完成以下步骤:使用逗号对作者进行切分; 剔除单个作者中非常规的字符在原始数据集中authors_parsed字段已经帮我们处理好了作者信息,可以直接使用

2021-01-16 21:26:17 133

原创 2021-01-13

Task1:论文数据统计目录1.1任务说明1.2数据集介绍1.3arxiv论文类别介绍1.4具体代码实现1.4.1导入package并读取原始数据1.4.2数据预处理1.4.3数据分析及可视化1.1任务说明任务主题:论文数量统计,即统计2019年全年计算机各方向论文数量 赛题的理解、使⽤ Pandas 读取数据并进⾏统计; 学习 Pandas 的基础操作;1.2数据集介绍 数据集来源:: https://www.kaggle.com/Cornell-.

2021-01-13 23:25:41 370

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除