数据分析_SQL数据分析--旅游数据分析可视化实操

1196e0e6ed5e9045b3c26b598c568091.png

SQL数据分析--旅游数据分析可视化实操。根据现有数据分析,具体操作情况如下:

33981940b323279656c331d230e36533.png

11ead1168179f125863e03cdd3748803.png

①用户个人信息,数据共有4列,userid:用户ID; gender性别;province省份;age年龄段

测试集,10076条+训练集,40307条数据

②用户行为信息:数据共有3列,userid用户ID;actionType行为类型;actionTime发生时间(行为类型一共有9个,其中1是唤醒app;2~4是浏览产品,无先后关系;5~9则是有先后关系的,从填写表单到提交订单再到最后支付。)

测试集,331204条+训练集,1048575条数据

③用户历史订单数据:数据共有7列,userid用户ID;orderid订单id;orderTime订单时间;orderType订单类型;(其中1表示购买了精品旅游服务,0表示普通旅游服务)city旅游城市;country国家;continent大陆

测试集,5059条+训练集,20653条数据

④待预测订单的数据,数据共有2列 userid用户id;orderType订单类型

测试集,10076条(无有效信息)+训练集,40307条数据

⑤评论数据数据共有5列,userid用户id;orderid订单id;rating评分;tags标签;commentsKeyWords评论内容。

测试集,2474条+训练集,9863条

互联网在线旅游--APP分析指标

营销推广指标:APP活跃用户数、各渠道下载量、注册用户数、分渠道注册转化、分渠道复购率(活动页面浏览数、分渠道浏览贡献)

运营指标:获取新客成本,活跃用户数、新增注册用户占比、各渠道用户留存,购买VIP服务占比,用户满意度

产品指标:活跃用户数、平均APP单次使用时长、平均APP日使用时长、页面访问时长、整体跳出率、注册转化率、VIP会员转化率。

557c29994b68355110697935f87966e8.png

86ec4efe9ced4060659af07727736343.png

三:数据清洗(此步骤在EXCEL数据分析时已处理,可见日求三餐:精品旅行服务数据分析--EXCEL初步分析)

950a22562f85c1eaa988cc45c139581d.png

1.列名重命名(把列名称更改为中英文便于理解)

2.删除重复值(由于是通过订单查询最受注册用户欢迎的旅游国家以及城市TPO10,以订单ID识别重复信息,查询无重复值)

3.缺失值处理

①.用户个人信息中用户ID,可以得知40307条数 ,性别:15706条缺失:24547条;省份:36412条,缺失:38951条;年龄段:4742条,缺失:35565条【由于年龄段数据缺失比重为88.23%】由此年龄段数据无法真实有效的体现,不可做重要分析项。(其中省份中确实部分填充为“未知”)

②.用户历史订单数据订单ID:20653条数据,其他各项均完整。

4.时间提取

①由于历史订单中订单时间是时间戳形式,无法具体识别订单时间,通过公式把时间戳更换成常规时间

②辅助列提取数据,为了便于统计不同年份最受欢迎的城市,需要把订单年份提取出来。

函数公式:=text(a2,"YYYY")

五:数据导入MYSQL

1、下载MySQL服务端和客户端。

服务端:猴子:超级详细的mysql安装指南

客户端:猴子:Mysql客户端:Navicat安装教程及问题汇总

2、导入下载数据表:(由于此次是初步分析,暂时只导入训练集数据)

6963331392fe47872e2316c4b85c4aa6.png

七:具体分析情况

问题1.1注册用户的情况,共计多少注册用户?

04c84a0c64c44775885a978d4116acb9.png

问题1.2注册用户城市分布情况?

49949ce33732fb096b395cd6b6a470ac.png

问题1.3消费用户占比(注册用户数量40307是由问题1.1获得)

ec5f7fe65ce74a307118231534aa37e6.png

17524affc12b882a8f94900c7bf34f19.png

问题1.4主流消费用户主要来自哪些省份?

7cd917d2ab4f65a82803b75462e25139.png

05ddbf624c391aa63d6c8c2563eef313.png

问题2.1目前最受注册用户喜欢的旅游国家?

7a0582d7c23df0409969393d799dcf59.png

b10d71c9ef0466a608c1e4cbeddc2150.png

问题2.2最受欢迎的旅游城市2016年TPO10

4481088eaffbf463da5251b0f8f0a85f.png

11369ccef1381f90ba86d0e31c306257.png

问题2.3最受欢迎的旅游城市2017年TPO10

12c97aec8a22ea3bf1d929bb128c6f51.png

0a8a9955275f9d966b7e9c499f825238.png

问题2.4最受欢迎的旅游城市TPO10

b1f2b2ee27fc4860010af20cb5dba221.png

0029d0a382cbf577966bf505f3041122.png

问题3.1消费用户的满意度情况

0382d760b5c7f363f28fb26a0cf5df3f.png

4aac88bb09ed562708a68bc2b04da2c0.png

问题3.2消费用户的不满意度情况分析

b97dd8332db3d23aab0755929a7cb866.png

5af6ca87988acc16f5367289c60b2f1a.png

通过上面的分析,我们可以得到的以下分析结论有:

  1. 注册用户共计40307个,其中主流消费用户占比26.39%,且注册用户和主流消费用户均来自一线城市和江浙地区(上海、北京、广东、江苏、浙江等)
  2. 最受欢迎的TOP10的国家分别是:日本、美国、澳大利亚、新加坡、泰国。
  3. 最受欢迎的TOP10的城市。分别是新加坡、东京、纽约、台北、吉隆坡、悉尼、香港、大阪、墨尔本、曼谷。不同的年份最受欢迎的旅游城市大致相同,但是也有不同。
  4. 其中2016年最受欢迎的TOP10的城市分别是新加坡、东京、悉尼、香港、曼谷、大阪、纽约、台北、普吉岛、墨尔本。2017年最受欢迎的TOP10的城市分别是东京、新加坡、吉隆坡、纽约、台北、香港、悉尼、大阪、墨尔本、曼谷。
  5. 消费用户的满意度较高,近95.78%的用户是非常满意的,但是也有一部分消费用户评分过低但是评论内容是满意,可能是误评,其他比较引起客户不满的问题是“司导态度差”“临时换司导”“车辆和订单显示不符”“临时换司导|车辆和订单显示不符”“不爱讲话”等

236836cfb00912f8e264b92798a7a514.png

10affdb9546b02233af80395c9ab7389.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值