python数据分析与基础实战_Python数据分析实战-基础篇

今天将详细讲解Pandas和Numpy包的知识,以下面的这个excel表格信息为数据例子进行实战分析。

案例链接:↓↓↓ 密码:e4fg(请自行下载按照讲解一步步实践)https://pan.baidu.com/s/1K-L1gPadfTUGFlFMzbUJtQ​pan.baidu.com

文章目录

一、一维数据分析入门

二、二维数据分析入门

三、实战篇

一、一维数据

Numpy包内的Array和Pandas包内的Series均用来创建及定义一维数据结构

1)array方法:我们可以将数据放到列表中,通过传参数的方式传给array来创建在Jupyter notebook中编辑python代码

Tips:

type(a) 可以查看a的数据结构

a.dtype 可以查看a结构内的数据类型

numpy array结构中的数据需要是同一种类型,这个有别于列表List(list数据类型支持同时存放多种数据类型)

2)Series方法:Series有别于array在于其有索引,且索引可以指定自定义

Tips:关于空值

1.使用dropna()方法去除结构中全部空值

2.使用fillna()方法可替换结构中空值

二、二维数据结构

通过Pandas中的DataFrame来构建,其每一列的数据可以支持多种数据类型,且其有行索引。

Tips:

:可以表示获取全部的数据

如df.loc[:,'size']---表示获取size这一列所有行内的数据

三、实例分析

第一步:数据读取(目的:理解数据+了解分析问题)

pandas模块有很强大的数据读取功能,可以轻松读取后缀为xlsx的excel文件,后缀为csv及txt的常见文件,默认编码模式为‘utf-8’。

以本次朝阳医院2018年销售数据为例,可通过如下方式读入

pd.read_excel('文件名')----这里我把文件存在跟python同一安装目录下无需再输入路径,dtype='object'----文件内所有数据列内的值修改默认数据格式为字符串格式data.head()--默认显示数据前5行 data.tail()--默认显示数据后5行

data.info()---可以查看数据框内所有列的数据信息

data.shape---可以查看数据结构,一共有多少行多少列数据

通过以上步骤我们大致理解了数据,并了解了本次分析的3个问题:

1)月均消费次数

2)月均消费金额

3)客单价

第二步:数据预处理/数据清洗无先后顺序

❤列名重命名

inplace=True---代表直接在原始数据上进行修改操作,这样就无需再重新赋值操作了

❤时间序列处理

data中销售时间这一列现在是字符串数据结构,我们想对它进行时间序列操作

1.删除星期多余数据

map函数能实现对Series内数据进行批量操作,配合lambda x:函数能快速提升我们的工作效率

❤2.pd_todatetime函数

pandas内的to_datetime函数非常强大,用来对数据进行时间序列转换errors='coerce',如原始数据为2018-02-33这样不符合时间规定的数据将返回为空值

❤3.排序

pd.sort_values(by='列名',ascending=False)默认ascending=True升序排列,能实现按照该列数据进行排列

reset_index(drop=True)能对索引按从0开始进行重新排序

❤4.数据类型转化

astype('数据类型')能实现对数据类型的修改

❤5.异常值处理

数据描述中销售数量最小值为-10,存在异常值,通过布尔值进行过滤

四、解决问题

问题1:月均消费次数 =总消费次数/月数

❤(同一个人同一天内发生的记录算一次消费)按销售时间和社保卡号去重取最后一天销售时间-最早一天销售时间的天数差求得整除的月份数,总行数除以月份数得到答案

问题2:月均消费金额=总消费金额/月份数

数据清洗方法如上,这次不用根据销售时间和社保卡号去重

问题3:客单价=总消费金额/总消费次数

数据清洗方法如上,总消费金额不用根据销售时间和社保卡号去重

总消费次数需要去重so easy☺

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值