【41 Pandas+Pyecharts | 全国星巴克门店数据分析可视化】

大家好,我是 👉【Python当打之年(点击跳转)】

本期利用 python 分析一下「全国星巴克门店数据」 ,看看我国各省份、各城市星巴克门店数量分布,营业时间分布情况 等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas — 数据处理
  • Pyecharts — 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Map
from pyecharts.charts import Geo
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df = pd.read_excel("./星巴克门店.xlsx")

在这里插入图片描述

2.2 查看数据信息

df.info()

在这里插入图片描述

2.3 计算营业时长

df['开始营业时间_1'] = pd.to_datetime(df['开始营业时间'])
df['停止营业时间_1'] = pd.to_datetime(df['停止营业时间'])
df['营业时长'] = df['停止营业时间_1'] - df['开始营业时间_1']
df['营业时长'] = pd.to_timedelta(df['营业时长'])
df['营业时长'] = df['营业时长'].dt.total_seconds()/3600
df['营业时长'] = df['营业时长'].apply(lambda x : x if x > 0 else x + 24)

在这里插入图片描述

2.4 营业时长区间

df['营业时长区间'] = pd.cut(df['营业时长'],bins=[0,8,10,12,14,16,24],labels=["0-8h","8-10h","10-12h","12-14h","14-16h","16-24h"])

在这里插入图片描述

🏳️‍🌈 3. Pyecharts数据可视化

3.1 各省星巴克门店数量柱状图

def get_bar1(x_data, y_data)
    bar1 = (
        Bar(init_opts=opts.InitOpts(width='1000px', height='800px'))
        .add_xaxis(x_data[::-1])
        .add_yaxis("", y_data[::-1], label_opts=opts.LabelOpts(position="right"))
        .reversal_axis()
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='1-各省星巴克门店数量分布',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return bar1

在这里插入图片描述

  • 上海市星巴克门店最多,超过了1000家。

  • 广东省、浙江省、江苏省、北京市以超过500家的门店分列第二至五位。

3.2 各省星巴克门店数量饼图

def get_pie(x_data, y_data)
    pie = (
        Pie(
            init_opts=opts.InitOpts(width='1000px', height='800px')
        )
        .add(series_name="",
             data_pair=[list(z) for z in zip(x_data, y_data)],
             radius=["30%",'50%'],
             center=["38%", "50%"],
             label_opts=opts.LabelOpts(is_show=False, position="center"),
             )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='各省星巴克门店数量占比',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
             visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                max_=600,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            ),
            legend_opts=opts.LegendOpts(is_show=True, pos_right="15%", pos_top="8%",orient="vertical"),
        )
        .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
    )
    return pie

在这里插入图片描述

3.3 各省星巴克门店数量地图

def get_map(x_data, y_data)
    map0 = (
        Map(
            init_opts=opts.InitOpts(width='1000px', height='600px')
        )
        .add("",
             [list(z) for z in zip(x_data, y_data)],
             maptype="china",
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='3-各省星巴克门店数量分布',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return map0

在这里插入图片描述

  • 从地图分布上可以很直观地看出东南沿海地区星巴克门店数量要远高于其他地区。

3.4 各城市星巴克门店数量TOP20

在这里插入图片描述

  • 从城市分布上看,北、上、广、深一线城市和杭州市星巴克门店数量均在200家以上,排在前五位。
  • 星巴克门店数量200家以上的城市还有苏州市、成都市、宁波市。
  • 南京市、武汉市、天津市、重庆市、西安市、无锡市等城市星巴克门店数量也在100家以上。

3.5 各城市星巴克门店数量热力图

在这里插入图片描述

3.6 星巴克门店开始营业时间分布

def get_map(x_data, y_data)
    line1 = (
        Line(
            init_opts=opts.InitOpts(width='1000px', height='600px')
        )
        .add_xaxis(x_data)
        .add_yaxis("", y_data)
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='6-开始营业时间分布',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
             visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return line1

在这里插入图片描述

  • 星巴克门店开始营业时间大多数集中在早上06:45-07:45这个区间内,有很少一部分在晚上20:00以后。

3.7 星巴克门店停止营业时间分布

在这里插入图片描述

  • 星巴克门店停止营业时间大多数集中在晚上21:00-22:00这个区间内,有很少一部分在晚上23:30以后。

3.8 星巴克门店营业时长区间分布

在这里插入图片描述

  • 星巴克门店总营业时长相对来说还是比较长的,有3178家营业时长达到了14-16个小时,2075家在12-14小时,10-12小时的有1381家。
  • 整体上营业时长10小时以上的占比达到了95%以上,14小时以上的占比约80%。

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

  • 25
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
星巴克案例是一个经典的数据分析案例,可以使用Python进行分析。以下是一个基本的Python代码框架,可以用来开始分析: 1. 数据清洗和预处理 在数据清洗和预处理阶段,你需要对数据进行清洗和转换,以便后续分析。这包括: - 删除缺失值 - 将分类变量转换为哑变量 - 对数值变量进行归一化或标准化 2. 探索性数据分析 在探索性数据分析阶段,你需要探索数据的分布、相关性和异常值。这包括: - 绘制直方图、箱线图和散点图 - 计算相关系数和协方差 - 检测异常值和离群值 3. 特征工程 在特征工程阶段,你需要创建新的特征或选择最相关的特征。这包括: - 选择最相关的特征 - 创建新的特征 - 对特征进行转换或缩放 4. 模型训练和评估 在模型训练和评估阶段,你需要选择合适的模型,并使用数据集进行训练和测试。这包括: - 选择合适的模型 - 分割数据集为训练集和测试集 - 训练模型并进行交叉验证 - 评估模型性能并进行调整 5. 模型应用和部署 在模型应用和部署阶段,你需要将模型应用到新数据,并将模型部署到生产环境中。这包括: - 使用模型进行预测 - 将模型部署到生产环境 - 监控模型性能并进行更新 以上是一个基本的Python代码框架,可以用来开始分析星巴克案例。在实际应用中,你需要根据具体情况进行调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Python当打之年

您的鼓励是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值