数据科学与大数据分析项目练习-4在数据集上应用线性回归算法

在数据集“income”上应用线性回归算法.

项目要求:

使用以下两种输入变量设置,对“收入”数据集应用线性回归算法
–年龄、教育程度和性别(模型A)。
-年龄和教育(模型B)。
–观察并解释输出

设置年龄=41,受教育程度=12,
–预测预期收入
–在置信区间收入的计算期望值
–计算预期收益的预测区间
–观察并解释他们的差异

Project Start

先查看下income数据集
在这里插入图片描述
一共有1500行5列的数据

# 首先还是先设置默认路径
setwd("c:/Users/T7/Desktop/123")
# 读取文件
income_input = as.data.frame(  read.csv("c:/Users/T7/Desktop/123/income.csv")   )
income_input[1:10,]
# 显示前10行
summary(income_input)
# 查看汇总

在这里插入图片描述
使用 R 的 lattice 工具包,生成散点图矩阵。

library(lattice)

splom(~income_input[c(2:5)],  groups
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值