python 数组升序_python简单数据清洗和分析

利用python学习了简单一维数组和二维数组,明白了集合、数组、字典大概的关联,并学会从中点用不同的数组类型进行更好的分析。

5627f4f8317caf4c70c031d0175a071f.png

读取excel文件,开始进行最简单的数据清洗。

ffd9fb9f7814046114dac583a72cee37.png

将购药时间重新命名为销售时间,即python可以实现对列名称进行更换。

33d264c0a84c6de657bf5894c9649c3e.png

因为最开始引用的数据格式全部为文本格式,现在需要将销售数据、应收金额、实收金额转换为浮点数据进行运算。

还需要进行一步:对数据表中的空值进行删除,以便后续处理。

函数的那一步意义为:将销售时间‘2018-01-01 星期五’用split函数进行分列,提取分析所需的信息,即‘2018-01-01’。其中用到了for循环和自定义函数。

05fd9955c8530d8cb8b8f6d73c6058a3.png

然后将销售时间数据的格式转换为日期格式,便于进一步的统计分析。(注意:在这一步的时候可能会出现日期格式数据出现控制,所以需要将空值进行删除)

在完成数据格式转换以后,用file.dtypes可以看到每一列的数据格式。

接下来将数据按照销售时间的升序排列。

39bcf201599f3167c2be768b69a80270.png

数据清洗完成后,可以开始数据分析或者数据运算。

945630f2abbcc64d2ebfdd4e657df1a1.png

这里用到了分组功能,因之前已经把销售时间数据变为了日期数据,所以可以根据月份分类,直接可以显示各个月份的销售数量、应收、实收金额。

0693e2ab4785f869526fcc6befed540c.png

应用以上内容,我将针对某微信公众号在2019年的数据进行简单统计分析。首先导入excel文件。

9914b950557ea306c85a9fd9504ae513.png

删除空值,将阅读量、当日涨、掉粉量和分享量的数据转为浮点型,把日期数据转为日期格式。

638d41f6b6b512a9ec76cf50a15f75b4.png

根据每个月的阅读量、分享量、当日涨粉、掉粉情况进行统计,并计算了2019年总的阅读量。

b0c7a89cfa87ee96bafc88a6146e2b2f.png

根据以上的学习,大概了解了用python清洗数据的过程,可以类比excel来想。在excel中可能运用数据透视表就可以很简单运行的东西,在python中对应的相对较复杂的变成语句,这个时候可以结合自己的熟练程度,进行不同软件的选择。在统计分析方面,python有固定的格式,可能以后会学到不同的语句。

在python语句运行中,需要特别小心,可能前一个语句重复运行尽毁导致下一个语句的无法运行,要更加细心。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值