基于R语言的数据分析报告

基于R语言的数据分析报告

(很多同学私信反馈通过kaggle没办法下载数据集,我把数据集上传到百度云供大家取用,链接:https://pan.baidu.com/s/1S48WWmtK-BcgF3jkwMfivw 密码:3pd6,求点赞求关注!)

一、数据说明

本文进行数据分析所使用的数据是共享单车运营数据,记录了共享单车租赁的时间、地点、环境(包括季节,温度,湿度)等数据。该数据集来自 kaggle 上的开源项目:https://www.kaggle.com/c/bike-sharing-demand/data。

通过分析这份数据,我们能观察到共享单车被使用的一般规律,用户的使用习惯,环境对共享单车运营带来的影响等有用信息,能够更好地帮助共享单车运营方的管理和研究城市的流动性。

二、数据分析

1. 读取数据

首先指定 wd 的路径,将数据集 train.csv 的数据读取到 R 语言中,使用变量 data 存储;在 train.csv 中,数据格式如下,每一条记录包括了时间、季节、是否是周末、是否是工作日、天气、温度、最高温度、湿度、风速、损坏车辆、登记使用车辆、总租赁车辆数等信息:

在这里插入图片描述
在本数据分析报告中,我们关注温度、湿度、风速、总租赁车辆数这四项数据,数据的读取如下:

library(showtext)
showtext_auto()

# 配置环境,读取数据
setwd("/Users/caitan/Desktop/方法论/rDataAnalysis")
data <- read.csv("train.csv", header = FALSE)

# 从data中读取温度、湿度、风速、损坏使用数据、登记使用数据,租赁总数据
temperature <- as.numeric(data[,6])
humidity <- as.numeric(data[,8])
windspeed <- as.numeric(data[,9])
casual <- as.numeric(data[,10])
register <- as.numeric(data[,11])
total <- as.numeric(data[,
  • 151
    点赞
  • 1210
    收藏
    觉得还不错? 一键收藏
  • 19
    评论
评论 19
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值