此系列文章收录在公众号中:数据大宇宙 > 数据处理 > pd
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
# 前言
有人说,用 pandas 做数据分析真的很方便,但是,总会有人反对,我们也不浪费时间讨论这无聊的问题。今天我们拿着疫情数据,看看怎样用 pandas 发现问题和解决问题。而持有反对意见的小伙伴,不妨用你最拿手的工具尝试按照本文的思路完成需求。
本文是我为准备 pandas 专栏的案例时摘录的一些小技巧应用,如果你希望完整学习所有相关知识,请关注我的 pandas 专栏
# 数据来源
数据取自 github 项目 BlankerL/DXY-COVID-19-Crawler 的其中一份 csv 地区疫情统计数据,实际上这个项目只是定时到丁香园网站上爬取某个时刻的数据。
数据大致如下:
- 一行记录表示,某时间点(updateTime)某地区(cityName)的各项疫情指标
- 由于网站上显示的是当前最新累计数据,因此本数据的统计指标同样是累计数值