R语言波士顿房价分析

最近帮GF用R语言做了一个波士顿房价的多元线性回归的作业,因为也是初次学习,可能内容会有一些问题,希望大家一起学习交流。
R用的是3.5.3版本,下载都是来自China.Lanzhou.
##########程序如下所示###########
###安装更新

install.packages(“installr”)
library(installr)
updateR()
#####安装包###
install.packages(“readr”)
install.packages(“funr”)
install.packages(“openxlsx”)
install.packages(“dplyr”)
install.packages(“caret”)
install.packages(“readxl”)
install.packages(“psych”)
install.packages(“plyr”)
install.packages(“ggplot2”)
install.packages(“rio”)
install.packages(“abind”)

##########加载包#####

library(readr)
library(funr)
library(openxlsx)
library(dplyr)
library(caret)
library(readxl)
library(psych)
library(plyr)
library(ggplot2)
library(zoo)
library(car)
############ 导入数据 ##########
path <- get_script_path()# 获取脚本路径
path = “C:/Users/shaon/Desktop/LWY/大作业”
setwd(path)
model_data <- read_csv(“Boston-house-prices.csv”)
str(model_data)#可以看到导入的数据
summary(model_data$MEDV)

在这里插入图片描述

hist(model_data$MEDV)#可以看到目标数据的总体分布
在这里插入图片描述

############ 数据分析#######
###形成相关系数###

cor(model_data[c(“CRIM”,“ZN”,“INDUS”,“CHAS”,“NOX”,“RM”,“AGE”,“DIS”,“RAD”,“TAX”,“PTRATIO”,“BRATIO”,“LSTAT”,“MEDV”)])
###散点图矩阵###
pairs(model_data[c(“CRIM”,“ZN”,“INDUS”,“CHAS”,“NOX”,“RM”,“AGE”,“DIS”,“RAD”,“TAX”,“PTRATIO”,“BRATIO”,“LSTAT”,“MEDV”)])
在这里插入图片描述
###改进后的散点图矩阵###
pairs.panels(model_data[c(“CRIM”,“ZN”,“INDUS”,“CHAS”,“NOX”,“RM”,“AGE”,“DIS”,“RAD”,“TAX”,“PTRATIO”,“BRATIO”,“LSTAT”,“MEDV”)])
在这里插入图片描述
#####基于数据训练模型,得到目标函数的系数#####
lmrelationship<-lm(MEDV~CRIM+ZN+INDUS+CHAS+NOX+RM+AGE+DIS+RAD+TAX+PTRATIO+BRATIO+LSTAT,data=model_data)
summary(lmrelationship)
在这里插入图片描述

可以看到R^2只有0.7406和0.7338,比较小,同时变量中有很多与目标变量相关度较低的,这里我们删去一些相关度不高的参数,只留下NOX,RM,DIS,RAD,PTRATIO,LSTAT,然后重复上述工作。

lmrelationship2<-lm(MEDV~NOX+RM+DIS+RAD+PTRATIO+LSTAT,data=model_data)
summary(lmrelationship2)

在这里插入图片描述
发现R^2的变化不大,说明删除的变量还算合理,这里如果希望删除更多变量或者提高R可以从不相关度从大到小逐个删除来比较。

#############异方差的检验#############
###G-Q检验###

res.test<-residuals(lmrelationship2)
library(lmtest)
gqtest(lmrelationship2)###p值很小时拒绝H0,认为上诉公式有相关性,存在异方差
在这里插入图片描述

###BPtest检验###

bptest(lmrelationship2)####p值很小时认为存在异方差
在这里插入图片描述

################修正异方差##################
异方差的修正关键在于取什么样的权重,我看网上其他资料采用的权重有1/e,1/e^2,1/x,1/sqrt(x),x ^2等等,这里以权重为1/e为例,

lmrelationship3<-resid(lmrelationship2)^2###将精简后模型的残差赋给lmrelationship3
lmrelationship4<-lm(MEDV~NOX+RM+DIS+RAD+PTRATIO+LSTAT,weights=1/abs(lmrelationship3),data=model_data)
summary(lmrelationship4)
deviance(lmrelationship4)###用来求残差平方和RSS
在这里插入图片描述
在这里插入图片描述

我们可以看到,R^2为0.9994有了很大的改善,RSS=501.2323这个有点大,但还不知道如何解决。
整理公式:MEDV=40.514-19.857NOX+4.0434RM-1.1900DIS+0.0515RAD-1.1300PTRATIO-0.5934LSTAT

###多重共线性检验

library(graphics)
library(car)
vif(lmrelationship4)#VIF小于10则共线性较小。
在这里插入图片描述

我们看到各个变量VIF都比较小,说明多重共线性不大。如果需要消除多重共线性可以采用逐步回归,或者手动删除变量。

lmrelationship2<-step(lmrelationship)

  • 10
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值