pyecharts geo_pyecharts&tableau可视化分析案例+分析思路

大家好,今天的视频是关于广州市的美食数据可视化分析,对美食的整体分布情况做了一个展示,加上一些美食推荐。我们从四个角度展示我们的数据,地理位置,商圈,得分,美食推荐。文章的重点在于(二)部分,该怎么讲好一个可视化的故事,同时该如何分析图中的insight。

(一)数据清洗

拿到的数据是两个主表和地理位置表

经过简单清洗后的数据如下所示:

2e843543b0e7f20a0d7953d85364c1df.png

清洗的过程主要包含表格合并,创建一些新字段,简单对文本进行手工清洗。

(二)可视化思路

首先是我们想讲一个怎么样的故事,在pre的过程中,你的核心故事线是什么,不要为了展示而展示,这个决定了你的展示的核心。

我简单提一个思路,作为城市展示宣传中的美食宣传(就是一个整体),消费者进餐指南,或者更有高端的从中分析美食行业进入的咨询报告(更像一份商业报告)。我水平有限,就做最简单的第一个,或者说有一点第一个和第二个的杂糅hhh。

原始的字段有这些“名称 评论数 人均价格 菜系 商圈 地址 推荐1 推荐2 推荐3 口味评分 环境评分 服务评分 星级 店铺ID 公共交通 纬度 经度 行政区名称”。

  • 地理位置

由于地理位置最直观,能够给客户(观众)留下印象,首先是地理位置展示,从这个角度,我们最容易想到是店铺数量在不同区域存在不同的分布,在这里我们给出了一个行政区的划分,所以很容易做出了第一个图,主要用不同颜色表示不同行政区的美食数量,为了横向比较一下数量,做了一个柱状图。

830230cb00687356bc207e187401ef96.png

第二个图则是将地理位置和价格联系到一起,采用了热力图的形式,热度表示价格,呈现了整个广州市区的价格热度分布。

0becac9a266ad7a004ded330998c5506.png

商圈

在地理位置之后,就是从商圈分析,商圈作为城市宣传或者美食指南中还是比较重要的,因为它涵盖了一系列美食,往往还有配套的娱乐设施,具有一体化的特征,商圈的消费水平也是为消费者提供的一个重要参考。

第一步针对餐厅个体做出一个直方图的分布,虽然上面一张PPT看上去满眼全是红色,但大部分的餐厅的人均消费水平都集中在50-100元的区间内,但同时也存在少部分大于500的极端值。

餐厅的级别以四星级和五星级为主,占比近9成,同时从直方图的颜色可以看出除了两个极端值外,各价位的星级分布没有明显差异。

b266754498f4e290a1a855fe55dc0972.png

这一张ppt我们统计了商圈的的人均价格中位数(剔除了商圈内包含样本数小于5的商圈),发现处于头部的四个商圈的人均价格中位数比剩余的高出一个断层,我们可以认为这四家商圈定位是高端的消费群体,进一步我们绘制了它们的分布地理图,从图中可以主要看出天河,越秀,海珠,荔湾等区域的中心或交界处,从地理位置看处于整个广州市的核心地带。从标记点颜色看,最低的价格有人均60左右的,最高的高达人均500的水平,整体价格从颜色看符合高端消费。

92022bd879aaa3461670352bbfbb1914.png

这一张PPT我们看处于平价消费的四家商圈,分别为江南西,中山七八路,芳村,江南大道,右侧是地理分布图,这些商圈主要集中在荔湾的中下部和与越秀区接壤的部分,海珠区的中部等。从映射图我们可以看出,基本没有红色的系比较深的点,整体人均价格在250以下,不存在任何极端值,这也能说明这些商圈的定位也是偏平价。

619f3ccbacfc5a2f975b81a65b313911.png

上面两种相对立的,定位于不同消费群体商圈除了在地理位置上有所区别之外,还有没有什么不同之处呢,我们对推荐菜品做了一个简单的词云分析,左侧是人均消费大于200的高端消费商家的推荐餐品,右侧是人均消费小于70的评价类商家的推荐菜品,我们还是可以明显看出了有一些差别,左侧主推的食物都是比较贵的,三文鱼,刺身,鹅肝,食材比较稀有,对品质要求较高。右侧的食物都是一些比较大众的五花肉,炸腐竹等,偏常规,食材易加工,附加价值较低。由此我们看出两者除了在位置上有差异,食品类别也有差异,定位区分度大,不易产生直接竞争。

7d7b16a40f75e84508d0fd71d308cab8.png

评分角度

从商圈角度讨论完之后,我们从大家最关心的评分角度看一下广州市的美食大众点评得分上呈现什么规律。从图形中看出口味、服务评分大致属于中心分布,环境评分左偏。左偏分布说明广州市的商铺的整体环境较好,相对的得分较高。

同时我们观察到环境评分和服务评分相关性较高,相关系数得到0.68,说明广州作为一线城市,商圈整体的质量较高,对餐饮的软性附加服务(服务质量和环境的)要求均达到很高的水准

此外,口味得分仍然是呈现一种中心分布,这也和食物口味这种东西相对来说更难量化,口味不一一等原因。

6b5f24186a53c72e9844ca29b94cb0f6.png

从菜系入手的菜品推荐

这两页ppt我们主要利用盒子图发现广州市提供的不同菜系的一些规律并给出推荐菜品。我们剔除了一些涵盖样本较少的菜系。

首先是价格分析自助餐和面包甜点的价格极差最大,整体来说自助,日料,西餐价格比较高,对于极差大的可以根据自己的消费能力选择到合适的店铺。

d1ab862b5abbab8a6cd49d95b6e0bc50.png

再是综合得分分析,我们将口味服务环境简单平均获得综合得分,韩国料理,日料,火锅,粤菜的综合评分极差很大,消费者挑选时注意踩雷的风险。

e1153889551bb27887e08967d85c225c.png

最后从综合得分中选取了前10名的餐厅,菜系主要集中在日料、面包甜点,也有少量西餐火锅粤菜;从地图看出主要分布在天河、海珠、白云区;人均价格从75-550元都有。感兴趣的朋友可以去尝试一下。

691c892cdcbb8ccc1e5f6d596dcd0769.png

(三)技术支持tableau+pyecharts

所有的地图主要完成都是通过pyecharts,本来可以用tableau的地图真的很方便,但是由于它不好显示行政区的边界,最后还是放弃了,选择码代码,用了geo和普通的地图两个模块。但是如果tableau的地图如果能把行政区的边界做出来的话,可以省了很多麻烦。具体的代码和数据我整理一下,如果想复现可以给我留言,欢迎大家交流学习。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值