使用了R语言自带的数据框mtcars,里面包含了各品牌型号的车辆参数信息。可以使用head()函数先查看下数据框信息:
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
绘制燃油效率分布图:
#使用par函数设置图形边界形状
op <- par(mar = c(10,4,4,2) + 0.1)
#使用barplot()设置绘制条形图,用以展示分类变量或连续变量的分布情况
barplot(mtcars$mpg, names.arg = row.names(mtcars), las = 2, ylab = "FuelEfficiency in Miles per Gallon")
使用pairs()函数绘制数据集对比图:
pairs(mtcars[1:7], lower.panel = NULL)
使用管道运算符号%>%(快捷键Shift+Ctrl+M)对数据集中的wt(车辆重量)进行分组,然后计算mpg(每加仑汽油行驶的英里数)的平均值,管道运算是将左边的运算结果以输入的方式传递给右边函数,操作步骤为:
x %>% f() %>% g()
先对x进行f()操作,再对操作结果进行g()操作。
再使用lm函数对response与数据集建模,根据模型,可以得到以下方程:
燃油效率 = 5.344 * 车辆重量 + 37.285
library(tidyverse)
plot(mtcars %>%
group_by(wt) %>%
summarise(mpg_avg = mean(mpg)))
mt.model <- lm(formula = mpg ~ wt, data = mtcars)
print(coef(mt.model)[2])
print(coef(mt.model)[1])