数据可视化每周挑战——全国星巴克门店数据可视化

最新推荐文章于 2025-05-10 17:38:45 发布

梦想成为一名机器学习高手

最新推荐文章于 2025-05-10 17:38:45 发布

阅读量888

点赞数 20

文章标签：信息可视化

本文链接：https://blog.csdn.net/qq_60688380/article/details/138867903

版权

这是我国星巴克门店的位置，营业时间等数据。

1.导入需要用的库，同时设置绘图时用到的字体，同时防止绘图时负号无法正常显示的情况。

import pandas as pd
from pyecharts.charts import Bar,Map,Line,Pie,Geo
from pyecharts import options as opts
import matplotlib.pyplot as plt

plt.rcParams['font.family'] = ['sans-serif']
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

2.读取数据，并且查看数据是否有缺失值等

data = pd.read_excel('D:/每周挑战/星巴克门店.xlsx')
data.info()

从上面可以看出该数据集中没有缺失值，且营业时间属于标成属性，但是实际中时间应该是时间类型，因此我们将其转换为时间，以便于后续的可视化

3.首先先对营业时间进行处理，然后对星巴克在我国分布省份进行统计汇总。

data['开始营业时间_1'] = pd.to_datetime(data['开始营业时间'])
data['停止营业时间_1'] = pd.to_datetime(data['停止营业时间'])
data['营业时长'] = data['停止营业时间_1'] - data['开始营业时间_1']
data['营业时长'] = pd.to_timedelta(data['营业时长'])
data['营业时长'] = data['营业时长'].dt.total_seconds()/3600
data = data.drop(['开始营业时间_1','停止营业时间_1'],axis=1)
data['营业时长区间'] = pd.cut(data['营业时长'],bins=[0,8,10,12,14,16,24],labels=["0-8h","8-10h","10-12h","12-14h","14-16h","16-24h"])
range_colors = ['#228be6','#1864ab','#8BC34A','#FFCA28','#FF5722','#D32F2F','#1DFFF5','#FF850E']
province_data = data['省份'].value_counts().reset_index()
x = province_data['index'].tolist()
y = province_data['省份'].tolist()
bar = (
    Bar(init_opts

最低0.47元/天解锁文章