挖掘菜品销售量之间的相关性可以得到不同菜品之间的关系,找出替补菜品、互补菜品或没有关系的菜品,为原材料采购提供参考。
例如,计算铁板酸菜豆腐与其他菜式的相关性系数。
代码:
from __future__ import print_function
import pandas as pd
food_sale = 'D:\Python练习使用数据/food_sale_all.xls'
data = pd.read_excel(food_sale, index_col=u'日期')
xg = data.corr()[u'铁板酸菜豆腐'] #显示铁板酸菜豆腐与其他菜式的相关系数
print(xg)
运行上述代码,结果为:
从以上结果可以看出,铁板酸菜豆腐与蜜汁焗餐包 、生炒菜心 、原汁原味菜心 相关性高,与其他菜式相关性低。
计算任意两个菜式之间的相关系数:
from __future__ import print_function
import pandas as pd
doc = open('out.txt', 'w')#将结果输出到文件out.txt中,注意运行文件与输出结果文件必须在同一个存储目录下。
food_sale = 'D:\Python练习使用数据/food_sale_all.xls'
data = pd.read_excel(food_sale, index_col=u'日期')
xg = data.corr() #相关系数矩阵,显示任意两款菜式之间的相关系数
#将结果完整显示
pd.set_option('display.max_columns',1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth',1000)
print(xg)
print(xg, file=doc)
doc.close()
运行结果为:
**注意:**如果没有这三行代码,
pd.set_option('display.max_columns',1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth',1000)
运行结果(文件里也是)会显示不完整,并用省略号代替:
并且:
doc = open('out.txt', 'w')
print(xg, file=doc)
doc.close()
这三行代码是将程序输出结果保存到文件out.txt(放在excel里就把后缀改成xls)中,并且必须放在程序运行的开头。
计算两种菜式(两个变量)的相关系数:
xg = data[u'乐膳真味鸡'].corr(data[u'生炒菜心']) #乐膳真味鸡与生炒菜心的相关系数
print(xg)
运行结果是:
表示这两个菜式的关系是0.3255,弱相关。。