用python实现一个完整的小案例

今天分享一个python的小实例,结合工作场景,对工作中经常会用到的一些函数进行实操。仔细阅读哦,适合新手小白的避坑指南~

在本文中,你可以领略到的知识点(坑)包括但不限于:

  • 如何成功导入一个csv文件?
  • 如何查看字段类型?
  • 如何对字段进行类型转换?
  • 如何使用日期转换函数?
  • 如何使用pivot_table?
  • 如何画图?

吼吼,直接上实例!

step1 导入各种包

妥妥的导入各种工具包,numpy, pandas之类的,这步一般不会出错,略过;

step2 导入文件

导入文件,工作中我们一般用csv文件,在存储的时候要存成utf-8格式的csv, 敲黑板哦!如果存错格式,会有各种报错。
在这里插入图片描述

step 3 数据清洗

这是经常会忽略的一步,你会看到上图中p_date的值都是20201027的样子,你确定这是int, 还是string还是啥呢? 你不确定,python就会坑你,后面可能会报错。需要先看一下数据类型, 这一步很重要,不信你试试。
在这里插入图片描述
所以你知道了,p_date在这里是int64,这里会对未来的计算有点影响哦。

(1) 先分享一个错误的方式,你看报错是说strptime的输入需要一个str形式,但是这里提供的是int格式。
在这里插入图片描述
(2) 正确方法是先转换成str格式,再利用日期转换函数
你看通过astype(str)将p_date转成string类型后,strptime就不会报错了。而转换好的p_date长这样‘2020-10-28’。
在这里插入图片描述

step4 计算(其实也是处理数据)

先做一下透视表,看一下每天不同reason(分类)下的new_cnt(某个新增数量)总和。
在这里插入图片描述
我们还想加一个比例,看一下各个reason的新增数量占比,可以这样写:
在这里插入图片描述
你可以看到,除了ratio, 还附赠了一个ratio_1, 而两个字段的类型是不同的哦,一个是float, 一个是string, 之后在计算或者画图的时候要区分。

step 5 可视化

想清楚图形展示的方式,x, y轴,legend分别是啥? 就可以开始画了~ 我们用pivot_table去实现, x是日期,columns代表legend, values则是y轴对应的数值,之后调用iplot就OK啦~
在这里插入图片描述
如果用ratio_1会怎样? 会报错啦,因为ratio_1是string类型,不能聚合呦。
在这里插入图片描述在这里插入图片描述
好,到这一步为止,你已经用python完成了一个简单的task, 恭喜!

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值