1.利用虚拟变量进行线性回归
(MEdata.csv的数据来源:https://github.com/ChenQihome9/CSDN-Data-Library/blob/master/MEdata.csv)
问题13:针对TAX~GDP,使用分段回归方法,找到其回归方程。编程,并根据程序结果叙述如下几方面问题:(1)分几段最佳?(不超过5段内)(2)分段位置定在哪儿最佳?(3)写出最佳方程,将最佳方程的曲线与数据点绘制到一幅图中。
观察GDP与TAX的图像,发现图形在GDP=800左右发生转折,利用分段线性回归进行拟合。
##### 13-01 #####
a <- read.table(file='MEdata.csv',header=T,sep=',')
attach(a)
summary(GDP) #获取GDP的数据特征,比如最小值、中位数、四分位数
plot(GDP,TAX)
L <- length(GDP)
t <- 1:L
Ddraw <- function(i){
D <- ifelse(t > i,1,0) #获取虚拟变量D不同分割
LM <- lm(TAX~GDP*