深圳市共享单车数据分析【文末附共享单车数据集清单】

修改时间: 2023年11月21日

目前最新的共享单车公开数据可能只有深圳市政府数据开放平台发布的共享单车企业每日订单表了,数据量包含2017-04-032021-08-30的2.4亿条数据,总计约24G大小:

《深圳共享单车企业每日订单表》在数据库中情况

深圳真不愧是改革先行者,公开的数据量如此庞大。

如此大量的数据,肯定不能直接下载。直接下载的文件仅包含本数据集的前10万条数据。

每条数据包含的字段:

USER_ID用户id
COM_ID企业 id
START_TIME开始时间
START_LNG开始经度
START_LAT开始纬度
END_TIME结束时间
END_LNG结束经度
END_LAT结束纬度

深圳数据开放平台也提供调用数据接口的方式进行下载:

数据接口(APIs) 是现代编程的基础,可以通过多种编程语言和工具实现。多种编程语言和工具,如JavaScript和Python,都可用于调用API。

每种方法都有其特定的使用场景和优势。选择哪种方法取决于你的项目需求、所用技术栈以及个人或团队的熟悉程度。例如,如果你正在开发一个Web应用,JavaScript可能是最直接的选择;如果是企业级后端系统,Java或C#可能更合适。对于脚本或自动化任务,Python或Shell命令可能是最简单的方法。

我们选用简洁性、受欢迎的Python来进行数据获取,使用的方法是requests库,或者可以使用http.client或第三方库如aiohttp(异步请求)。

具体调用说明见网站上的【调用说明】。

鉴于数据量巨大(2.7亿条共享单车订单数据),我们无法将其全部保存在Json或csv文件中,因此需要选择合适的数据库进行存储。

订单数据包括时间序列和地理空间数据,因此需要一个既能高效处理大规模数据集,又支持时间和空间查询的数据库。

以下是一些推荐的数据库选项:

  1. PostgreSQL + PostGIS扩展:

    • PostgreSQL是一个强大的开源关系数据库系统。
    • 通过PostGIS扩展,它可以有效处理地理空间数据。
    • 支持复杂的查询和索引,适合时间序列和空间数据。

    更多信息查看:https://developer.aliyun.com/article/832610

  2. MongoDB:

    • MongoDB是一个灵活的NoSQL文档数据库。
    • 它支持地理空间索引和查询。
    • 更适合快速开发和水平扩展。

另外根据我对数据库的熟悉情况,我选择MongoDB来储存我的数据库。


所以我们只需用Python写一个requests请求,然后将数据储存到数据库。

花了一点时间(实际在我的树莓派上静静地跑了一天程序)之后,获取了全部24G的数据。

若有按时间获取数据的需求,可通过增加startDate和endDate参数对数据进行筛选。你可以

接下来简单来探索下深圳市共享单车服务的使用情况。

这次先取一天——2021年8月5号的数据。

将坐标统一为GPS坐标后我们进行简单的可视化,如下图,每个红色点代表一个共享单车的出发点:

这天的订单数据共计超过一百万条,并且每条数据包含订单的开始和结束的时间以及经纬度信息,当然其中有很多离群值,需要进一步筛选,也就是数据清洗。

由于没有提供开关锁的状态,无法从订单状态筛选数据,通过观察发现可以从订单的距离、平均速度、起终点是否在深圳市进行数据清洗

我直接删除了订单距离为0米以及订单距离大于40km的数据,总的数据量从1158199减少到1132736。

我们用这部分数据进行共享单车的使用模式分析,还能结合空间分布,进行一定程度的空间数据分析。

因此,我们首先对数据进行描述,重点关注骑行时间、骑行次数和骑行距离的分布。

一、数据描述

1.骑行时间分布

观察共享单车的使用时间,我们发现了城市生活的节奏。早晚高峰时段的数据高峰,不仅反映了上下班的人潮,还揭示了车辆分配和维护的最佳时机。

这张图是一个柱状图,显示了2021年8月5日深圳市共享单车订单在24小时内的分布情况。横轴代表一天中的小时(从0点到23点),纵轴代表订单数量。

从图中可以观察到,在早上的某个时段(8点左右)有一个明显的订单数量峰值,大家开始上班了。随后的几个小时内,订单数量逐渐下降,直到下午时段(16点到17点之间)订单数量再次上升,形成第二个高峰,这可能与人们下班的时间相对应。到了晚上,订单数量逐渐减少,直到深夜时段达到最低点。

这样的分析有助于共享单车运营商了解用户的使用模式,从而更有效地调配车辆,确保在需求高峰时有足够的车辆可供使用。

2.骑行次数与地点

通过统计不同区域的骑行次数,我们绘制出了城市的热力图。

将热力图保存为html网页,此网页有30M大小,在线访问速度可能很慢,想要的可以关注微信公众号“renhai-lab”发送“深圳共享单车热力图1”获取网页的下载链接。

3.出行距离分布

出行距离分布

这张图包含了四个子图,它们显示了不同规模的数据分布情况。每个子图都有一个X轴,表示“骑行距离(米)”,和一个Y轴,表示“概率”。这些图似乎是概率密度函数(PDF)的图形表示,每个子图覆盖不同的骑行距离范围,展示了共享单车骑行距离的分布情况。

在这些子图中,可以观察到随着骑行距离的增加,概率逐渐下降,这表明短距离骑行的频率较高。这是符合预期的,因为人们通常倾向于使用共享单车进行短途出行。随着距离的增加,选择骑行的用户可能会减少,从而导致概率下降。这些图可能用于分析骑行距离的典型值,从而帮助共享单车公司优化他们的车辆分布和调度策略。

以上仅为一部分数据分析工作,我们还可以绘制平均出行时间图交通小区之间的出行量共享单车的起点-终点图(OD图),例如绘制全市OD图获取、单个站点的OD图,例如下图是上海某日共享单车到达某地铁站点衔接图——图源自《交通时空大数据分析、挖掘与可视化(Python版)》,描述的是同济大学地铁站周边共享单车换乘地铁的分布图。

在这里插入图片描述

今天先写到这,此文章会在我的博客更新,可以点击阅读原文访问。

如果你对本文章有什么意见、对如何制作文中的图表感兴趣、或者有其它任何问题可以在博客的评论区留言,或者通过微信公众号发送私信给我。

请添加图片描述


共享单车公开数据清单

1.深圳市共享单车企业每日订单表

数据简介:深圳市政府数据开放平台发布的共享单车企业每日订单表了,数据量包含2.4亿条数据。

时间:2017-04-032021-08-30

链接:https://opendata.sz.gov.cn/data/dataSet/toDataDetails/29200_00403627

数据预览:


搜索数据的时候发现有人已经整合过了:以下内容由微信公众号【立方数据学社】发表在【数据分享】8个城市的共享单车数据(数据量约10亿条\免费获取),本文选了国内的城市,国外的数据可以访问原文查看。

2.上海市的摩拜单车数据

时间: 2016年8月

数据简介: 和鲸社区用户分享的共享单车数据,包括上海市2016年8月的摩拜单车数据,共十万余条。数据链接为:https://www.heywhale.com/mw/dataset/5d315ebbcf76a60036e565bf

数据字段: 订单编号、车辆编号、用户编号、起始时间、起始位置、结束时间、结束位置、轨迹

3.北京市摩拜数据(摩拜杯算法挑战赛)

**数据简介:**2017摩拜算法挑战赛公布的共享单车数据,包括北京市2017年5月两周之内40余万共享单车被30多万用户使用的情况,包括300余万条出行记录。数据链接为:https://www.biendata.xyz/competition/mobike/data/

**数据字段:**订单号、用户ID、车辆ID、车辆类型、骑行起始日期时间、骑行起始区块位置、骑行目的地区块位置

4.厦门市共享单车数据

**数据简介:**2021数字中国创新大赛公布的厦门市2020年12月21日-2020年12月25日五天的共享单车轨迹数据。数据链接为:https://data.xm.gov.cn/contest-series/digit-china-2021/index.html#/3/competition_data

**数据字段:**共享单车ID、定位时间、经度(WGS84坐标)、纬度(WGS84坐标)、共享单车来源

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
共享单车数据分析在现代城市交通中发挥着重要的作用。通过对共享单车数据的分析,我们可以了解用户的出行习惯、出行需求及地理分布等信息,为城市交通规划和运营提供有益的参考。 首先,共享单车数据可以帮助我们了解用户的出行习惯。通过分析不同时间段和地点的共享单车使用情况,可以了解到用户出行的高峰时段和热门地点。这些信息对于优化共享单车的投放策略和调度安排非常重要,能够提高用户的出行体验和服务质量。 其次,共享单车数据还可以帮助我们了解用户的出行需求。通过对用户的出行距离、出行目的地和出行时间等数据的分析,可以了解到用户在不同场景下的出行需求。例如,某些地区可能需要更多的共享单车供应,而另一些地区可能需要更多的停车位。这些信息可以为城市交通规划者提供指导,帮助他们更好地满足市民的出行需求。 最后,共享单车数据还可以帮助我们了解城市交通的地理分布情况。通过分析共享单车的使用热点和用户分布,可以了解到城市交通网络的状况和人口聚集区的分布。这对于城市交通规划者来说非常重要,可以帮助他们优化道路网络布局和公共交通线路规划,提高城市的交通效率和出行便利性。 总而言之,共享单车数据分析是一项重要的工作,可以为城市交通规划和运营提供有益的参考。通过对共享单车数据的分析,我们可以了解用户的出行习惯、出行需求及地理分布等信息,从而优化共享单车的投放策略和调度安排,提高城市交通的效率和服务质量。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Renhai实验室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值