以下是我对共享单车项目分析的案例
数据来源:Bike Sharing Demand | Kagglewww.kaggle.com
一. 需要分析的问题
结合数据集中天气、温度、日期等因素,分析美国某城市共享单车使用情况。
二. 理解数据
使用pandas.read_csv方法读取数据集,查看其前五行。
我们可以看到数据集拥有12个标签:
datetime:时间(年-月-日 时:分:秒)
season:季节(1:春天,2:夏天,3:秋天,4:冬天)
holiday:节假日(0:否,1:是)
workingday:工作日,即这一天既不是法定节假日也不是周末(0:否,1:是)
weather:天气(1:晴天,2:阴天,3:小雪或小雨,4:大雨,冰雹或雷暴
temp:实际温度(摄氏度)
atemp:感受温度(摄氏度)
humidity:湿度
windspeed:风速
casual:未注册用户租借数量
registered:注册用户租借数量
count:总租借数量
观察数据,我们可以发现,count 主要分析的对象