共享单车数据可视化分析报告
目标:
1.通过使用python的pandas库进行外部数据的读取、数据清理、数据整理或者数据汇总。
2.通过tableau制图研究各种影响因素对共享单车租车人数的影响作用,得出合理的结论并对租车公司关键性建议。
一、Python导入、查看数据
导入数据
import pandas as pd
data1=pd.read_csv(r'D:\tableau\共享单车\train.csv',sep=',')
查看数据
data1.shape#查看数据规模
(10886, 12)
data1.dtypes#查看表中各变量的数据类型
datetime object
season int64
holiday int64
workingday int64
weather int64
temp float64
atemp float64
humidity int64
windspeed float64
casual int64
registered int64
count int64
dtype: object
该数据包含100886行12列数据,其名称意义为:
datetime 时间
season 季节(1234分别为春夏秋冬)
holiday 节假日(0否 1是)
workingday 工作日(0否 1是)
weather 天气(1晴天 2阴天 3小雨小雪 4恶劣天气)
temp 实际温度
atemp 体感温度
humidity 湿度
windspeed 风速
casual 未注册用户
registered 注册用户
count 租借数量
通过dtypes方法返回了数据集中各变量的数据类型,直观感觉数据类型都是正确的。