发现许多小伙伴入门Python几个月,还是低效率做数据处理。这套课程以形象的示意图,精心安排的案例,循序渐进带你玩转数据处理分析神器——pandas,课程中还有分析案例噢,干货满满!
前言
想象一下你有一份销售数据,你能够解决以下哪些问题:
日销量,周销量,月销量如何?
哪些是工作日中最好卖的产品。周末呢?如果包含一些节假日呢?
销量在一个月的时间内,周销量一直保持上升或下降的产品有哪些?
销量出现大幅波动的产品有哪些?是在什么时间点上出现波动?
这些从简单到复杂的需求,都与时间处理有关,而且这只是冰山一角。掂量一下你手上的数据工具,Excel、Sql,各种 BI 工具?哪个可以轻易解决上述问题?
本课程接下来的章节将带你解决这些问题,并教会你实现思路。我们开始吧!
日期列
课程上一节我们已经学会了如何把日期数据正确解析出来,现在来看看处理日期类型的数据有哪些套路。
实例1:出生日期处理
pandas 中最基础的日期类型是'时间点',工作中比较常见的是出生日期。 现在,我们有一份客户信息表:
数据中有一列'出生日期'
先看看,怎么从日期列获取'年月日':
从结果上来看看,我们已经成功提取年月日信息
有人注意到,代码中的 '.dt' 是什么意思?
在 pa