共享单车数据模型

最新推荐文章于 2024-03-03 01:53:49 发布

温室花朵

最新推荐文章于 2024-03-03 01:53:49 发布

阅读量3k

点赞数 4

分类专栏：机器学习之共享单车数据集分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43357051/article/details/90048662

版权

这篇博客分析了来自UCI的共享单车数据集，包括数据预处理、删除不需要的列，然后用随机森林构建回归模型进行预测。通过模型评估得到均方误差、解释方差分和R平方得分。

摘要由CSDN通过智能技术生成

这是我个人采集的一共共享单车的数据的分析
这是共享单车数据模型，里面都打了详细的注释，如果还不明白请私信我

本次使用的数据集来源于加利福尼亚大学欧文分校（UCI）大学的公开数据集：https://archive.ics.uci.edu/ml/dat
asets/Bike+Sharing+Dataset，关于本次数据集的各种信息可以参考该网站，同时也可以直接从该网站下载和使用
数据集。本次共享单车数据集包含有两个文件，一个是按天来统计的共享单车使用量数据，另一个是按照小时数来
统计的使用量。
说句题外话，这个共享单车数据集是在2011年至2012年间收集的，此处的共享单车是采用固定桩形式的单车，类
似于中国的永安行，并不是我们目前所看到的满大街的小黄车，小蓝车，摩拜之类。
下载后，将数据集解压到D:\PyProjects\DataSet\SharingBikes中。本数据集总共有17389个样本，每个样本有16
列，其中，前两列是样本序号和日期，可以不用考虑，最后三列数据是不同类型的输出结果，最后一列是第十四列
和第十五列的和，因此本模型中不考虑第十四列和第十五列

下面主要数分析数据集的

准备数据集

import pandas as pd
import numpy as np

分析数据集，导入地址首先分析day数据
dataset_path = ‘F:\JupyterLab

最低0.47元/天解锁文章

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。