引言
本章内容介绍了多元线性回归一些好玩且实用的专题:
- 改变自变量(因变量(对数自变量)当度量单位对因变量(自变量)、系数、t值、F值等的影响
- 自变量和因变量标准化以后B系数的解释
- 对数-水平模型下,B系数当精确解读以及二次模型来表明边际递增或递减当情况
- 调整的R方的好处以及缺点(这个倒是第一次见识)
- 构造估计值和预测值的一个置信区间
- 残差分析
本文代码和整理好的数据见这里
此篇博客开始,每一题上方都会来个小标题,表明该题涉及到当重要技术细节,以供参考。
C6.1 二次项模型的加入以及解释
data_kielmc<-read.csv('/home/wangjianlong/files/programs/college_life/econometrics/excel_data_1/kielmc.csv',header = T)
lm_kielmc<-lm(log(Price)~log(dist),data=data_kielmc)
#预期 垃圾焚化炉离住房越远,价格越高,系数符号应为正。
summary(lm_kielmc)
#log(Price)=8.25750+0.31722 log(dist)
#距离相隔每增加百分之一,平均来说,价格变每上升0.31%
#(2)
lm_kielmc_1<-lm(log(Price)~log(dist)+log(intst)+log(area)+log(land)+rooms+baths+age,data=data_kielmc)
summary(lm_kielmc_1)
## 系数从0.31722减小到0.0281887 ,因为增加了更多了更多变量来解释价格当变化,焚化炉距离远近对价格影响效应减弱。
#(3)