共享单车数据模型

这篇博客分析了来自UCI的共享单车数据集,包括数据预处理、删除不需要的列,然后用随机森林构建回归模型进行预测。通过模型评估得到均方误差、解释方差分和R平方得分。
摘要由CSDN通过智能技术生成

这是我个人采集的一共共享单车的数据的分析
这是共享单车数据模型,里面都打了详细的注释,如果还不明白请私信我

本次使用的数据集来源于加利福尼亚大学欧文分校(UCI)大学的公开数据集:https://archive.ics.uci.edu/ml/dat
asets/Bike+Sharing+Dataset,关于本次数据集的各种信息可以参考该网站,同时也可以直接从该网站下载和使用
数据集。本次共享单车数据集包含有两个文件,一个是按天来统计的共享单车使用量数据,另一个是按照小时数来
统计的使用量。
说句题外话,这个共享单车数据集是在2011年至2012年间收集的,此处的共享单车是采用固定桩形式的单车,类
似于中国的永安行,并不是我们目前所看到的满大街的小黄车,小蓝车,摩拜之类。
下载后,将数据集解压到D:\PyProjects\DataSet\SharingBikes中。本数据集总共有17389个样本,每个样本有16
列,其中,前两列是样本序号和日期,可以不用考虑,最后三列数据是不同类型的输出结果,最后一列是第十四列
和第十五列的和,因此本模型中不考虑第十四列和第十五列

下面主要数分析数据集的

准备数据集

import pandas as pd
import numpy as np

分析数据集,导入地址 首先分析day数据
dataset_path = ‘F:\JupyterLab

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值