城市餐饮店铺选址分析
数据下载链接:
链接:https://pan.baidu.com/s/1l2-EEMhK0-n8gFPLuOHb1g
提取码:7olt
要求:
1、从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行比较,并筛选出可开店铺的餐饮类型
要求:
① 计算出三个维度的指标得分
② 评价方法:
口味 → 得分越高越好
性价比 → 得分越高越好
人均消费 → 价格适中即可
③ 制作散点图,x轴为“人均消费”,y轴为“性价比得分”,点的大小为“口味得分” (暂时未涉及)
绘制柱状图,分别显示“口味得分”、“性价比得分”
- 建议用bokeh做图(暂未涉及)
提示:这是现在的重心
① 数据清洗,清除空值、为0的数据
② 口味指标计算方法 → 口味评分字段,按照餐饮类别分组算均值,再做标准化处理
③ 人均消费指标计算方法 → 人均消费字段,按照餐饮类别分组算均值,再做标准化处理
④ 性价比指标计算方法 → 性价比 = (口味 + 环境 + 服务)/人均消费,按照餐饮类别分组算均值,再做标准化处理
⑤ 数据计算之前,检查一下数据分布,去除异常值(以外限为标准) - 这里排除了高端奢侈餐饮的数据干扰
⑥ 注意,这里先分别计算三个指标,再合并数据(merge)作图,目的是指标之间的噪音数据不相互影响
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
os.chdir(r"D:\项目07城市餐饮店铺选址分析")
df = pd.read_excel("上海餐饮数据.xlsx")
"""
计算口味\单价\性价比指标
"""
# 数据清洗 1 删除空值 2 删除0值
df1 = df[["类别","口味","环境","服务","人均消费"]]
df1.dropna(inplace=True)
df2 = df1[df1["人均消费"]>0][df1[