以下内容以餐饮行业菜品日销量为原数据(表1),分析各菜品之间的相关性。分析这些菜品日销售之间的相关性可以得出不同菜品之间有没有关系,如是替补菜品、互补菜品或者没有关系,为原材料采购提供意见。
日期 | 百合酱蒸凤爪 | 原味菜心 | 红烧肉 | 百合凤爪 | 生炒菜心 | 翡翠鸡 |
2024/1/1 | 17 | 15 | 7 | 5 | 15 | 10 |
2024/1/2 | 10 | 14 | 8 | 8 | 15 | 8 |
2024/1/3 | 16 | 21 | 2 | 1 | 11 | 7 |
2024/1/4 | 8 | 12 | 15 | 12 | 10 | 6 |
2024/1/5 | 7 | 5 | 6 | 1 | 7 | 4 |
2024/1/6 | 6 | 6 | 7 | 7 | 2 | 2 |
2024/1/7 | 15 | 9 | 9 | 8 | 5 | 1 |
表1 某饭店菜品日销量数据
以下代码仅供参考:
import pandas as pd
catering_sale = "C:\\Users\\Dell\\Desktop\\菜品相关性.xlsx" #餐饮数据,含有其他属性
data = pd.read_excel(catering_sale,index_col = '日期') #读取数据,指定‘日期’列为索引列
print(data.corr()) #相关系数矩阵,即给出了任意两款菜式之间的相关系数
print(data.corr()['原味菜心']) # 只显示“原味菜心”与其他菜式的相关系数
print(data['原味菜心'].corr(data['翡翠鸡'])) #显示“原味菜心”和“翡翠鸡”之间的相关系数
当运行print(data.corr())时会得到以下的结果,通过这个数据我们可以看出两两元素之间的相关性系数,例如百合酱蒸凤爪和原味菜心的相关系数为0.696058。(以下数据位置已手动调整过)
当运行print(data.corr()['原味菜心'])时会得到以下结果,通过这个数据可以看出点原味菜心和别的菜品的相关性强弱情况。从这个结果可以看出,如果顾客点了原味菜心,那么点生炒菜心、翡翠鸡、百合酱香凤爪的相关性就高。相反,点红烧肉、北河凤爪的菜品的相关性较低。