将python运用到实际案例分析中(第四关作业)
本章节主要分为两个部分,一是理解数据分析,二是分析销售数据案例析销售数据案例
一、理解数据分析
此处又分为一维数据分析、二维数据分析
一维数据分析用Numpy(array)和pandas(series)
用Numpy定义一维数据:a=np.array([1,2,3,4]), 可以实现查询元素、切片访问、查看数据类型等多种功能
用pandas定义一维数据:a=pd.series([1,2,3,4]), 可以用Stocks.descbibe()用于获取统计信息,iloc属性用于根据位置获取值,loc属性用于根据索引获取值
二维数据分析用Numpy(array) 和pandas(dataframe)
定义二维数据:a=np.array([1,2,3],[4,5,6]),可以查询元素,获取某行或某列数据。
pandas表示数据框(dataframe)时,可制作有序的数据框,计算平均值,iloc属性用于根据位置查询值,loc属性用于根据索引查询值。
二、销售数据分析案例
解决问题的思路:提出问题—理解数据—数据清洗—构建模型——数据可视化
其中,1.提出问题:本案例中业务指标1-3是需要解决的问题,需根据提出的问题构建模型。
业务指标1:月均消费次数=总消费次数/月份数
业务指标2:月均消费金额=总消费金额/月份数
业务指标3:客单价=总消费金额/总消费次数
2.数据清洗步骤:选择子集、列表重命名、缺失数据处理、数据类型转换、数据排序、异常值处理
以下为第四章作业代码汇总:
ps:本来有截图修改过的,但是一导入文档又变成之前的图片了,所以看上去有一点混乱。
食品药品的案例
读取表格数据
SalesDf.head()打印前5行
查看列的数据类型:dtype
有多少行多少列:shape
每一列的统计数:SalesDf.describe()
、