NYC-transport 项目推荐

NYC-transport 项目推荐

NYC-transport A Unified Database of NYC transport (subway, taxi/Uber, and citibike) data. NYC-transport 项目地址: https://gitcode.com/gh_mirrors/ny/NYC-transport

1. 项目基础介绍和主要编程语言

NYC-transport 是一个开源项目,旨在整合纽约市多种公共交通数据,包括地铁、出租车/Uber 和 CitiBike 的数据。该项目的主要编程语言是 Python,并使用了多种数据处理和分析库,如 Pandas、Dask、PySpark 等。

2. 项目核心功能

该项目的主要功能包括:

  • 数据下载:从多个公开数据源下载纽约市公共交通数据,包括地铁、出租车/Uber 和 CitiBike 的数据。
  • 数据清洗:对下载的数据进行清洗,去除损坏的数据,确保数据质量。
  • 数据转换:将清洗后的数据转换为 Pandas DataFrame,并使用 Dask 和 FastParquet 将其保存为 Parquet 格式文件。
  • 数据分区:使用 PySpark 对 Parquet 文件进行重新分区,以提高后续查询的效率。
  • 数据分析:在 Jupyter 笔记本中使用 PySpark 和 Dask 进行数据分析,生成数据科学结果。

3. 项目最近更新的功能

由于引用内容中没有提供具体的更新日志或最近更新信息,因此无法提供具体的最近更新功能。建议访问项目的 GitHub 页面查看最新的提交记录和更新内容。

NYC-transport A Unified Database of NYC transport (subway, taxi/Uber, and citibike) data. NYC-transport 项目地址: https://gitcode.com/gh_mirrors/ny/NYC-transport

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卓勇闻Egil

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值