3.2 -3.4 数据特征分析

这篇博客主要展示了如何使用Python进行餐饮销售数据的分析,包括菜品销售的统计、菜品贡献度的确定以及相关性分析。通过排序和可视化手段,探讨了如何识别并优化盈利最高的菜品。同时,提到了Python相对于Excel的优势,并提供了部分代码示例,如二维线图、饼图等图表的绘制。
摘要由CSDN通过智能技术生成

demo/data/catering_fish_congee

这个文件是“捞起生鱼片”的销售数据,书上的文件名写错了,注意改一下。


内容主要是这个菜从 2014/4/1 到 2014/6/30 的销售额。

其实这里没给代码,给的结果,看起来这里用 Excel 也能很好完成的。

同时给了很多分析方法。不过本文主要是代码实践,就不写了。


针对餐饮销量数据有一个统计分析代码:

#-*- coding: utf-8 -*-
#餐饮销量数据统计量分析
from __future__ import print_function
import pandas as pd

catering_sale = 'data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列
data = data[(data[u'销量'] > 400)&(data[u'销量'] < 5000)] #过滤异常数据
statistics = data.describe() #保存基本统计量

statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位数间距



print(statistics)

这段代码里面需要说一下的就是 Pandas 中的 .loc 方法。

statistics.loc['dis'] 
这个代码的意思就是选择一列进行操作,这里就是 dis 列。


整个代码运行结果:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值