数据分析学习(一)

本文是数据分析学习的第一部分,主要介绍了学习目标、内容和产出。目标是掌握初步的数据分析知识,特别是Pandas的使用。内容包括统计2019年计算机方向论文数量,使用Pandas进行数据读取和统计。数据集包含arXiv ID、作者、期刊信息等字段。环境配置使用了Python 3.7.4和相关库。代码实现了数据的导入和读取。
摘要由CSDN通过智能技术生成

学习目标:

初步学习数据分析知识


学习内容:

任务主题:论文数量统计,即统计2019年全年计算机各个方向论文数量;
任务内容:赛题的理解、使用 Pandas 读取数据并进行统计;
任务成果:学习 Pandas 的基础操作。


学习产出:

数据集介绍

数据集来源:数据集来源.
数据集的格式如下:
id:arXiv ID,可用于访问论文;
submitter:论文提交者;
authors:论文作者;
title:论文标题;
comments:论文页数和图表等其他信息;
journal-ref:论文发表的期刊的信息;
doi:数字对象标识符
report-no:报告编号;
categories:论文在 arXiv 系统的所属类别或标签;
license

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值