在数据集上应用线性回归算法
在数据集“income”上应用线性回归算法.
项目要求:
使用以下两种输入变量设置,对“收入”数据集应用线性回归算法
–年龄、教育程度和性别(模型A)。
-年龄和教育(模型B)。
–观察并解释输出
设置年龄=41,受教育程度=12,
–预测预期收入
–在置信区间收入的计算期望值
–计算预期收益的预测区间
–观察并解释他们的差异
Project Start
先查看下income数据集
一共有1500行5列的数据
# 首先还是先设置默认路径
setwd("c:/Users/T7/Desktop/123")
# 读取文件
income_input = as.data.frame( read.csv("c:/Users/T7/Desktop/123/income.csv") )
income_input[1:10,]
# 显示前10行
summary(income_input)
# 查看汇总
使用 R 的 lattice 工具包,生成散点图矩阵。
library(lattice)
splom(~income_input[c(2:5)], groups