当前,在许多城市中引入了租赁自行车以增强移动舒适性。重要的是要在适当的时间向公众提供和出租自行车,因为这样可以减少等待时间。但是,为城市提供稳定的租赁自行车供应成为一个主要问题。关键部分是要预测稳定租用自行车每小时所需的自行车数量。利用以下数据对Rented Bike count指标进行线性回归。
数据集包含天气信息(温度,湿度,风速,能见度,露点,太阳辐射,降雪,降雨),每小时租用的自行车数量和日期信息。
要求:
- 了解数据集基本信息,并进行一些基本的描述性分析;
data = read.csv("SeoulBikeData.csv")
str(data)
数据集中一共有5796个数据
library(tidyverse)
summary(data$Rented.Bike.Count)
每小时租用的自行车数平均数是705, 中位数是504,最大值是3556
number_data = data %>% select(where(is.numeric))
library(ggcorrplot)
number_data %>%
cor() %>%
round(2) %>%
ggcorrplot(hc.order = TRUE,lab = TRUE)