![338ecd0b8c6cf6f22f46fac9c8bbeb0b.png](https://i-blog.csdnimg.cn/blog_migrate/d935ae5ba0b1e1350af203693816c29d.jpeg)
一、提出问题
要分析的问题:基于共享单车的用户数据,使用K-Means聚类分析,对共享单车的用户进行分群,对共享单车的骑行情况进行探索,提供给业务运营的建议。
二、数据预处理
![4e826ae61002b05e412f1294f14fcd0d.png](https://i-blog.csdnimg.cn/blog_migrate/dffeaf1c4ad7b836fb3a507000536059.jpeg)
![273f551cca74515800f830d286f8cd64.png](https://i-blog.csdnimg.cn/blog_migrate/62898632dfd223b50775c06f725a8095.jpeg)
![5c3cceb1b83585b029367bbe575dae6c.png](https://i-blog.csdnimg.cn/blog_migrate/b0b1012c0a4d587777451e66ae1f9122.jpeg)
![9065ce3199d9784434009f788f964e6c.png](https://i-blog.csdnimg.cn/blog_migrate/21f6706a0a5c26d12bf3aa58d96a216f.jpeg)
![112b9bdc6a1e4fe2f48b26e783f4c1e3.png](https://i-blog.csdnimg.cn/blog_migrate/1db355d1854a53da1455086a5ebd5967.jpeg)
![08c445c2491df887ba3b2755d0f663af.png](https://i-blog.csdnimg.cn/blog_migrate/21f1fc79aceb8784aed2e62c7939515e.jpeg)
![06d5c8f4b17e35df75e6230a5ad37a27.png](https://i-blog.csdnimg.cn/blog_migrate/7d31b99563a1d1530667a48f7aef7827.png)
三、数据标准化处理
![bfb21595aa0b2fcac5d2d1beddc439b4.png](https://i-blog.csdnimg.cn/blog_migrate/1b99419f520f70aa970a458e6a7104ec.jpeg)
![6d705211ce6ba2cb20954084aa0d0a37.png](https://i-blog.csdnimg.cn/blog_migrate/659293b461701c2ec27a71ea594cd23b.jpeg)
![a6330e5f85009ac8c6a48d68f0907642.png](https://i-blog.csdnimg.cn/blog_migrate/57daf347a0ba9182faccf29d2739a84d.png)
四、模型建立
运用K-Means算法对相关特征进行训练
![b422f1e27b4e1697c04e892996af43c9.png](https://i-blog.csdnimg.cn/blog_migrate/17ada6afda8be573d5c48960b2221aeb.jpeg)
![dda7f25c3500c9ac019bc84a82d9edd3.png](https://i-blog.csdnimg.cn/blog_migrate/5bee6977d295bf93e5a50d4de369b7d1.jpeg)
![322c554352601f81adf1a658a3332783.png](https://i-blog.csdnimg.cn/blog_migrate/76e121d673adf4a35fe4c738e58fb4c8.png)
![86f85487fc547ba2e5466016abc2c032.png](https://i-blog.csdnimg.cn/blog_migrate/61daabe0b8d14d9ad686b015dd130bec.jpeg)
![b3267dfc93b5ac62e0266c28df24dbbc.png](https://i-blog.csdnimg.cn/blog_migrate/99648946be5ef717ee0ccdd70fbcdd81.jpeg)
五、数据解读
#类别0: 该群体为男性群体,占比达27%,年龄偏大,骑行时间段主要集中在9点至16点的时间段;
#类别1: 该群体为男性群体,占比达20%,骑行时间集中在晚高峰16点至19点;
#类别2: 该群体为男性群体,占比达16%,骑行时间集中在早高峰6点至9点;
#类别3: 该群体主要为男性,占比达12%,年龄偏年轻,骑行时间集中在自由时间19点至24点;
#类别4: 该群体为女性群体,占比达9%,骑行时间集中在9点至16点;
#类别5: 该群体主要为男性,占比达5%,骑行时间集中在0点至6点,骑行时间与距离较短;
#类别6: 该群体为女性群体,占比达6%,骑行时间集中在晚高峰16点至19点,且骑行时间与距离较长;
#类别7: 该群体为女性群体,占比达5%,骑行时间集中在早高峰6点至9点;
结论:
1.上下班的早高峰时间段,用车需求量较大,可能为上班族或学生,比起女性用户,男性用户使用共享单车的比例更大;
2.年轻用户偏向于在晚上的自由时间段骑行,年龄偏大的用户偏向于在白天的自由时间段骑行;
3.女性群体的骑行时间与距离相对较长;
4.早上凌晨(0-6点)的骑行人数较少,用车需求量少,且骑行距离较短
六、其他指标
6.1 平均骑行时长,超过30分钟的比例
![54233af01b9ca78d9f8562ce4a217241.png](https://i-blog.csdnimg.cn/blog_migrate/2890913694e86a731cc27afbd8cf0977.jpeg)
6.2 会员与非会员的平均骑行时长
![4c225430ff40baf55a05b6a79430efe2.png](https://i-blog.csdnimg.cn/blog_migrate/bccbe1d6c78e95128dfe0de55ee500ac.png)
6.3 周末、工作日骑行时间对比
![554dd17f8adbe99347ba5f1dbeafe8d4.png](https://i-blog.csdnimg.cn/blog_migrate/b7ada7ae9fc16115da6a86871a75173f.jpeg)
6.4 一天哪个时间段使用最频繁
![ea53bb36d030418c3dbeb93c595fed33.png](https://i-blog.csdnimg.cn/blog_migrate/fe23a44da7739dc2ed29525c72b1bf78.jpeg)
![79084492451109cb33e7519de1ce5513.png](https://i-blog.csdnimg.cn/blog_migrate/eeb37f0931ef6aef91964743f2bc9e99.jpeg)
6.5 最受欢迎的站点
![0d11d40d9a33047b21789d8775d920ef.png](https://i-blog.csdnimg.cn/blog_migrate/1f652b2b0da3e765eab6e4b5cac936d0.png)
为了避免很多人一下子到这些站点取车,结果用户到了之后会发现:车不够取得尴尬场面。从而给竞争对手有机可乘,应该在进一步调研之后加大在这些站点的单车投放量。
七、业务建议
1.上下班用户群体,该群体对单车需求刚性较大,使用时间也较固定,可结合地理数据维度找到该客户群使用频率最集中的地理位置及时间段,适当增加共享单车的供应及路标,以避免出现供不应求的情况导致用户流失;
2.针对临时性需求但骑行距离较长的散客用户,可增加拉新活动,如骑行累积时长或距离助力环保换取合作线下店铺消费券,通过内容吸引消费者以培养环保意识,普及骑行文化,最终提升用户粘性并完成订阅转化;
3.节假日周末时,骑行需求会相应上升,可以搞一些促销活动,提高转化率与订阅;建立完备的会员积分系统,优化用户体验,提升用户粘性与病毒性;
4.制定关于骑行时长的定价策略,提高用户变现收益;建立奖励机制或成就系统,鼓励用户多骑行,形成使用习惯或消费习惯,保持长期活跃