数据相关性分析---菜式之间的相关性

挖掘菜品销售量之间的相关性可以得到不同菜品之间的关系,找出替补菜品、互补菜品或没有关系的菜品,为原材料采购提供参考。
  例如,计算铁板酸菜豆腐与其他菜式的相关性系数。
 代码:

from __future__ import print_function
import pandas as pd

food_sale = 'D:\Python练习使用数据/food_sale_all.xls'
data = pd.read_excel(food_sale, index_col=u'日期')
xg = data.corr()[u'铁板酸菜豆腐'] #显示铁板酸菜豆腐与其他菜式的相关系数
print(xg)

运行上述代码,结果为:
在这里插入图片描述
  从以上结果可以看出,铁板酸菜豆腐与蜜汁焗餐包 、生炒菜心 、原汁原味菜心 相关性高,与其他菜式相关性低。
计算任意两个菜式之间的相关系数

from __future__ import print_function
import pandas as pd

doc = open('out.txt', 'w')#将结果输出到文件out.txt中,注意运行文件与输出结果文件必须在同一个存储目录下。
food_sale = 'D:\Python练习使用数据/food_sale_all.xls'
data = pd.read_excel(food_sale, index_col=u'日期')
xg = data.corr()  #相关系数矩阵,显示任意两款菜式之间的相关系数
#将结果完整显示
pd.set_option('display.max_columns',1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth',1000)

print(xg)
print(xg, file=doc)
doc.close()

运行结果为:
在这里插入图片描述
**注意:**如果没有这三行代码,

pd.set_option('display.max_columns',1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth',1000)

运行结果(文件里也是)会显示不完整,并用省略号代替:在这里插入图片描述
并且:

doc = open('out.txt', 'w')
print(xg, file=doc)
doc.close()

这三行代码是将程序输出结果保存到文件out.txt(放在excel里就把后缀改成xls)中,并且必须放在程序运行的开头。
计算两种菜式(两个变量)的相关系数:

xg = data[u'乐膳真味鸡'].corr(data[u'生炒菜心'])  #乐膳真味鸡与生炒菜心的相关系数
print(xg)

运行结果是:
在这里插入图片描述
表示这两个菜式的关系是0.3255,弱相关。。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值