共享单车数据爬取_共享单车数据探索性分析

338ecd0b8c6cf6f22f46fac9c8bbeb0b.png

一、提出问题

要分析的问题:基于共享单车的用户数据,使用K-Means聚类分析,对共享单车的用户进行分群,对共享单车的骑行情况进行探索,提供给业务运营的建议。

二、数据预处理

4e826ae61002b05e412f1294f14fcd0d.png
查看数据集基本信息

273f551cca74515800f830d286f8cd64.png

5c3cceb1b83585b029367bbe575dae6c.png

9065ce3199d9784434009f788f964e6c.png
处理数据异常值

112b9bdc6a1e4fe2f48b26e783f4c1e3.png

08c445c2491df887ba3b2755d0f663af.png
将骑行起始时间分为5歌区间去统计各时间段内的骑行情况

06d5c8f4b17e35df75e6230a5ad37a27.png

三、数据标准化处理

bfb21595aa0b2fcac5d2d1beddc439b4.png

6d705211ce6ba2cb20954084aa0d0a37.png
选取特征,并分析各自之间的相关性

a6330e5f85009ac8c6a48d68f0907642.png
对tripduration和age做min-max归一化,使其落在[0,1]区间上

四、模型建立

运用K-Means算法对相关特征进行训练

b422f1e27b4e1697c04e892996af43c9.png
用肘方法评估合适的K值(K个类别)

dda7f25c3500c9ac019bc84a82d9edd3.png
K=8是的平均轮廓系数较大,选取K=8进行聚类,并为用户数据打上类别标签

322c554352601f81adf1a658a3332783.png
统计8个类别的占比

86f85487fc547ba2e5466016abc2c032.png
统计8个类别各特征的均值并展示

b3267dfc93b5ac62e0266c28df24dbbc.png
观察各类别中的特征情况,作为分析依据

五、数据解读

#类别0: 该群体为男性群体,占比达27%,年龄偏大,骑行时间段主要集中在9点至16点的时间段;
#类别1: 该群体为男性群体,占比达20%,骑行时间集中在晚高峰16点至19点;
#类别2: 该群体为男性群体,占比达16%,骑行时间集中在早高峰6点至9点;
#类别3: 该群体主要为男性,占比达12%,年龄偏年轻,骑行时间集中在自由时间19点至24点;
#类别4: 该群体为女性群体,占比达9%,骑行时间集中在9点至16点;
#类别5: 该群体主要为男性,占比达5%,骑行时间集中在0点至6点,骑行时间与距离较短;
#类别6: 该群体为女性群体,占比达6%,骑行时间集中在晚高峰16点至19点,且骑行时间与距离较长;
#类别7: 该群体为女性群体,占比达5%,骑行时间集中在早高峰6点至9点;

结论:

1.上下班的早高峰时间段,用车需求量较大,可能为上班族或学生,比起女性用户,男性用户使用共享单车的比例更大;
2.年轻用户偏向于在晚上的自由时间段骑行,年龄偏大的用户偏向于在白天的自由时间段骑行;
3.女性群体的骑行时间与距离相对较长;
4.早上凌晨(0-6点)的骑行人数较少,用车需求量少,且骑行距离较短

六、其他指标

6.1 平均骑行时长,超过30分钟的比例

54233af01b9ca78d9f8562ce4a217241.png

6.2 会员与非会员的平均骑行时长

4c225430ff40baf55a05b6a79430efe2.png

6.3 周末、工作日骑行时间对比

554dd17f8adbe99347ba5f1dbeafe8d4.png

6.4 一天哪个时间段使用最频繁

ea53bb36d030418c3dbeb93c595fed33.png
总体与会员的骑行热度基本上一致

79084492451109cb33e7519de1ce5513.png
可以看出总体与会员在上下班高峰的8点、17点、18点达到高峰;而非会员在14点达到高峰

6.5 最受欢迎的站点

0d11d40d9a33047b21789d8775d920ef.png

为了避免很多人一下子到这些站点取车,结果用户到了之后会发现:车不够取得尴尬场面。从而给竞争对手有机可乘,应该在进一步调研之后加大在这些站点的单车投放量。

七、业务建议

1.上下班用户群体,该群体对单车需求刚性较大,使用时间也较固定,可结合地理数据维度找到该客户群使用频率最集中的地理位置及时间段,适当增加共享单车的供应及路标,以避免出现供不应求的情况导致用户流失;
2.针对临时性需求但骑行距离较长的散客用户,可增加拉新活动,如骑行累积时长或距离助力环保换取合作线下店铺消费券,通过内容吸引消费者以培养环保意识,普及骑行文化,最终提升用户粘性并完成订阅转化;
3.节假日周末时,骑行需求会相应上升,可以搞一些促销活动,提高转化率与订阅;建立完备的会员积分系统,优化用户体验,提升用户粘性与病毒性;
4.制定关于骑行时长的定价策略,提高用户变现收益;建立奖励机制或成就系统,鼓励用户多骑行,形成使用习惯或消费习惯,保持长期活跃

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值