这是我个人采集的一共共享单车的数据的分析
这是共享单车数据模型,里面都打了详细的注释,如果还不明白请私信我
本次使用的数据集来源于加利福尼亚大学欧文分校(UCI)大学的公开数据集:https://archive.ics.uci.edu/ml/dat
asets/Bike+Sharing+Dataset,关于本次数据集的各种信息可以参考该网站,同时也可以直接从该网站下载和使用
数据集。本次共享单车数据集包含有两个文件,一个是按天来统计的共享单车使用量数据,另一个是按照小时数来
统计的使用量。
说句题外话,这个共享单车数据集是在2011年至2012年间收集的,此处的共享单车是采用固定桩形式的单车,类
似于中国的永安行,并不是我们目前所看到的满大街的小黄车,小蓝车,摩拜之类。
下载后,将数据集解压到D:\PyProjects\DataSet\SharingBikes中。本数据集总共有17389个样本,每个样本有16
列,其中,前两列是样本序号和日期,可以不用考虑,最后三列数据是不同类型的输出结果,最后一列是第十四列
和第十五列的和,因此本模型中不考虑第十四列和第十五列
下面主要数分析数据集的
准备数据集
import pandas as pd
import numpy as np
分析数据集,导入地址 首先分析day数据
dataset_path = ‘F:\JupyterLab