大众点评数据分析

3 篇文章 0 订阅
2 篇文章 0 订阅

一、项目背景

民以食为天,每个地区都有令我们自己向往的美食,鲁菜、粤菜、川菜、各种特色菜,都是我们中国特色美食,本篇通过大众点评官网爬取的数据分析全国各地美食,服务,物价水平等。

 二、项目介绍

本项目主要是对大众点评中全国范围内一二线城市美食信息进行分析,通过python数据处理以及通过tableau可视化。整个项目分为项目目的的确定、数据的预处理、对数据的分析和项目总结这五个部分。

三、项目流程

项目目的

各地区美食占比,美食种类划分,对各地物价对比,各地美食服务,环境,口味评价对比。

数据来源

来自微信公众号(路人甲TM)提供的数据

数据预处理

主要是运用python预处理。

导入模块

读取数据

整体观察

 

查看数据详情

 重复值处理

缺失值处理

 由于数据缺失严重,但为使数据严谨,将缺失数据删除(如果有必要,可以用平均数或者中位数替换)

可视化分析

 

 由图可看出北京,天津,上海,深圳,广州,成都的美食餐厅相对较多,餐厅总量大于9000,顾客的选择性广泛。

 

由图可看出,主销售面包甜点的餐厅最多,其次是火锅,火锅是中国特有的美食,西餐的占比排名第三,说明西餐在我国的销售可观,另外对于爱吃辣的本博主,更重视川菜的排行,排名紧跟第四,不愧是无辣不欢的爱辣人士。

 

 由图可看出北京,上海的均价极高,其次是深圳,均价反映城市消费水平,说明北京,上海,深圳城市的消费水平颇高。

 

 

 

 由城市评价人数柱状图可看出,顾客的参与度以北京、上海、广州居前三,也说明新增游客在、对于餐厅的点评参考度丰富,可能间接提高新增游客,由上图三个饼图对于各城市口味、服务、环境水平占比(口味评价以大于8为优,大于5小于8为良,小于5为差),可看出优质口味,服务,环境均占比20%以上,有百分之70以上为良,各餐厅应向着优质口味,服务,环境发展以吸引更多客户

最终完成了以下仪表板,可通过筛选器随机选中目标城市进行对比

 项目总结

这次项目结合了python,tableau,这也是本博主第一次制作分析报告,有很多不足的地方希望大家能够指点,也可通过私信我一起学习数据分析,之后本博主可能推出更多分析报告,或者数据分析思维,sql的使用等,为了明天,一起加油吧!

 

  • 2
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: AI Challenger 大众点评数据集是一种非常有价值的开放数据集,它包含了丰富的餐厅评价信息和用户点评,可以被用于各种自然语言处理方面的研究和数据挖掘应用。这个数据集的特点是不仅数据量巨大,而且数据种类繁多,包括用户点评、餐厅信息、菜品信息、口味信息、环境信息等等,是一个十分灵活且多元化的数据集。 通过使用大众点评数据集,可以完成多种自然语言处理任务,如商品评论情感分析、餐厅评价分类和聚类、口味和菜品的研究等等。同时,这个数据集还为自然语言处理研究者和数据科学家提供了一个开放的平台,可供研究者调整和完善自己的算法,进一步提升模型的准确性和效率。 另外,这个数据集的开源性也方便了学界和业界的研究人员进行合作和数据共享,为促进自然语言处理和数据科学领域的进步和发展提供了更多的实际应用。因此,AI Challenger 大众点评数据集是一个非常有价值和非常有前景的数据集,有着广阔的应用场景和发展潜力,对自然语言处理和数据科学领域的研究和发展起到了积极的促进作用。 ### 回答2: AI Challenger是一个人工智能开发者大赛,旨在促进人工智能技术的发展与推广,同时也为企业和创业者提供更多的机会和平台。在此次大赛中,大众点评提供了一个数据集,为赛事添彩不少。 该数据集包括8000多万的用户评论与评分信息,来自14个城市的20个种类的商家和30万的用户。数百GB的数据被提供,涵盖了各种餐馆、酒店、影院、KTV等场所的评论。这些数据被打包为一个json格式的文件,并附带了详细的字段说明和示例。 通过这个数据集,参赛者可以进行各种分类、文本情感分析、数据挖掘等相关的任务。除了为参赛者提供了大量的评论数据,该数据集还附带了一些基础的统计数据和分析结果,以帮助参赛者更好地理解和利用数据。 大众点评作为中国领先的本地生活服务平台,已经积累了海量用户评论和评分数据。这些数据为用户提供了更好的消费体验,同时也为开发者提供了宝贵的机会来研究和开发新的人工智能技术。大众点评的数据集对于AI Challenger的成功举办和推广,也起到了重要的作用。 ### 回答3: AI Challenger 大众点评数据集是一个广泛应用于数据挖掘和机器学习的实际场景数据集。它由大众点评提供,包含 210 万条有关于餐饮店、购物商场、酒店等方面的评论数据,以及多个特征标签。这些评论对基于语言的模型及建立情感分析、自然语言处理和推荐系统等 AI 应用具有很高的价值。该数据集涵盖了用户对商品的实际评价,包括对商品的评价总体满意度、点赞数等信息,因此可以在交叉验证的情况下做更完整的数据分析。此外,数据集还以商家的位置、类别和名称为基础,可以被应用于基于位置的推荐系统。大众点评数据集不仅仅是大众点评领域内,还可应用于全行业领域的研究和应用,旨在促进智能化以及数据挖掘和机器学习技术的发展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值