pingjia = data[i][‘allCommentNum’]
dizhi = data[i][‘address’][0:3]
junjia = data[i][‘avgPrice’]
youhui = 1 if len(data[i][‘dealList’]) > 0 else 0
df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
s = s + 1
来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据👇
首先看下重庆市不同地区的火锅店分布,找火锅店嘛,总要找火锅店多的地区,这样能选择的店铺也更多
从上图可以看到,重庆市的火锅店基本集中在渝中区、渝北区、沙坪坝区、南岸区,并且经过进一步的计算可以得到这四个区的火锅店总数为388家,在所有进入统计的重庆市27个区县共750家店铺中占到了超过一半,所以优先去这四个区,十步一家火锅店,总有你要的!
在对地点分析之后,我们来对吃火锅的时间进行分析,以评论数量代替同时吃火锅的人数,并使用Pandas提取含有时间的评论并进行整理得到不同时间的人流量与平均评分
从上图可以看到,重庆人民吃火锅的时间集中在下午和晚上,并且高峰期集中在晚上7点至11点
,所以想安安静静吃火锅可以避开这段时间。不过从整体评价来看下午的评价不太好,反而晚上10点之后的评价比较高,可能是大家对于老板也耐心等候表示认可👇
每个店铺下的评价都有顾客评价的标签
本节我们通过绘制好评用户的矩形数图来看下带有哪些标签的火锅店获得的好评更多
从上图可以看出除了味道赞,重庆人更喜欢去回头客多、上菜快的店铺,所以当我们寻找一家火锅店的时候,点开店铺评价,按照带有上面标签找准没错。
在挑选一家火锅店的时候,价格也是很重要的一项参考指标,本节对人均价格绘制直方图同时添加对应价格的平均分曲线👇
可以看到,虽然重庆火锅店多,但是人均价格超过一百的并不多,大多集中在50—80之间,并且不是越便宜得到的评分越高,反而平均分最高的一个价格区间为100-110,其次是70-80,所以想要火锅吃的爽,至少准备一百块。
相信大家都会在去吃火锅之前看下商家是否有代金券/团购,所以本节使用箱线图对重庆市火锅店的优惠信息进行分析
图中箱子越宽说明数量越多,可以看到大部分商家是出售代金券的,是否有代金券对于高分评价没啥影响,但是有代金券的最低分是0分而没有代金券的商家最低分是3+,所以并不是一定要选有优惠的,有时没有优惠可能体验更好哦。
假设通过上面的分析,我们已经找到了一家火锅店准备开吃,本节继续通过提取评论关键词来看看网友爱点什么菜
从上图可以看到,最受重庆人民喜爱的肉是牛肉,蔬菜爱选豆芽,喜欢吃油碟的人更多,当然羊肉、毛肚也不能少。
在对店铺的影响因素分析完之后,本节对采集到的近万条评论数据进行词云分析,看看大家都在说什么
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!