第1关:数据探索与可视化
任务描述
本关任务:编写python代码,完成一天中不同时间段的平均租赁数量的可视化功能。
相关知识
为了完成本关任务,你需要掌握:
读取数据
数据探索与可视化
读取数据
数据保存在./step1/bike_train.csv中,共享单车的训练集数据总共有8709个训练样本,训练样本中有12个特征(其中count为标签)。
从可视化结果可以看出,临时用户和注册用户用车数量变化趋势大体一致,且两年间都在秋季左右达到了比较高的用车辆,说明美国人也都比较喜欢在这段时间外出游玩。这是符合常理的。
接下来看看天气对租赁数量的影响,代码如下:
讲道理,天气比较好的时侯,骑共享单车的人才比较多。但上图中像4(恶劣天气)这种天气的租赁数量也比较高,这是不是有点反常呢?
那么一天中不同时间段对于租赁数量有什么样的影响呢?这个就留给你做练习吧。
编程要求
根据提示,在右侧编辑器Begin-End处补充代码,将./step1/bike_train.csv中的数据按照hour这个特征分组,然后求每一组的count的平均值。并使用matplotlib.pyplot绘制折线图,并保存到./step1/result/plot.png。
测试说明
平台会对你生成的折线图与正确答案进行比对,因此请按照以下要求可视化:
折线图的figsize为(10, 10)
折线图的标题为average count per hour
测试输入:
预期输出:你的答案与正确答案一致
开始你的任务吧,祝你成