初识python数据分析小案例

初识python_数据分析小案例

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt #数据分析三个模块
data = pd.read_excel(r"F:\7月销售额分布.xlsa") #导入数据源
data #输出所有数据
data.head() #输出部分数据
data.shape #输出数据(有几行、几列数据)

data.describe() #数据的描述性分析

data.sort_values(by='销售额',ascending = False).head() #排序:对‘销售额’进行排序,ascending=False表示降序

data1=data.groupby(['区域'])[['销售额','毛利额']].mean() #按区域分组查看各区域的店日均销售额、毛利额
data1 #输出数据
data1.sort_values(by='销售额',ascending=False) #通过排序方便查看输出的结果

data2=data.loc[(data.['毛利额']<1000)]  #按1个条件查询
data2.sort_values(by='毛利额').head() #输出
data3=data.loc[(data['毛利额']<1000)&(data['区域']=='南宁配送中心')]  #按多个条件查询
data3.sort_values(by='毛利额').head() #输出

data.pivot_table(values=['销售额'],index=['区域'],aggfunc=['sum','mean','max','min']).head() #透视表

data4=data.pivot_table(values=['销售额'],index=['区域'],aggfunc=('mean'))
data4.plot.bar(figsize=(4,3))
plt.show  #柱形图

data5=data.pivot_table(values=['销售额'],index=['区域'])
data5.plot.box(figsize=(4,3))
plt.show    #箱线图  查看销售额的分布区间
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值