本节选取自行车的租赁数据,利用numpy、pandas、matplotlib三个库,数据清洗后,做数据分析,研究时间段与自行车租赁的关系。
数据来源
本节以自行车的租赁数据为例,数据来源于网络,利用时间序列分析的方法,通过可视化技术,分析自行车租赁随时间及天气变化的分布情况,其中datetime、season、holiday、workingday、weather、temp、atemp 、humidity、windspeed、casual 、registered、count字段分别代表租赁时间、季节、是否为假期、是否为工作日、天气数字越大,天气越差、temp atemp气温、湿度、风速、普通用户、注册用户、租赁自行车数量。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
bike = pd.read_csv(open(r'D:\python数据分析\数据\bike.csv'))
bike.head()
问题探索
研究时间段与自行车租赁的关系情况。
数据清洗
bike.isnull().sum()
查看缺失值,无缺失值。
bike.dtypes
查看数据类型,datetime字段不是时间数据类型。
bike['datetime'] =