R语言之含定性变量的回归模型xt10.3&xt10.4

本篇内容探讨了采用某保险革新措施的速度与保险公司规模及类型之间的关系,通过回归分析发现股份制公司比互助型公司更积极采纳革新,且公司规模越大,采纳速度越快。同时,针对我国历年铁路里程数据进行折线回归分析,发现在1995年存在转折点,采用折线模型能有效拟合数据变化趋势。
摘要由CSDN通过智能技术生成

第10章 含定性变量的回归模型

10.3 研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考文献[3])。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料如表10-8所示,试建立y对公司规模和公司类型的回归。

i y x1 公司类型
1 17 151 互助
2 26 92 互助
3 21 175 互助
4 30 31 互助
5 22 104 互助
6 0 277 互助
7 12 210 互助
8 19 120 互助
9 4 290 互助
10 16 238 互助
11 28 164 股份
12 15 272 股份
13 11 295 股份
14 38 68 股份
15 31 85 股份
16 21 224 股份
17 20 166 股份
18 13 305 股份
19 30 124 股份
20 14 246 股份

rm(list=ls())

data10.3 <- read.csv('D:/rwork/应用回归/习题数据/表10-8.csv',head=TRUE)
attach(data10.3) #将该数据框添加到R的搜索路径,以便于下面直接使用数据框中的数组x和y
type <- data10.3[,4]
levels(type) #使用levels函数查看type的水平
num1 <- which(levels(type) == '互助') #获取因子水平为互助的位置
levels(type)[num1] <- 1 #将水平为互助的重新赋值为1
num0 <- which(levels(type) == '股份') #获取因子水平为股份的位置
levels(type)[num0] <- 0 #将水平为股份的重新赋值为0
type

lm10.3 <- lm(y~x1+type,data=data10.3)
summary(lm10.3) #回归分析
anova(lm10.3) #方差分析表

detach(data10.3) #与attach()相对应,将数据框从搜索路径中移除

# 把公司类型为互助型设为1,股份型设为0,可得到回归方程y^=41.93-0.10x1-8.06x2

结果分析:
(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;
(2)公司规模越大,采取保险革新措施的倾向越大:大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。




10.4 表10-9的数据是我国历年铁路里程数据,根据散点图观察在1995年(t=16)有折点,用折线回归拟合这些数据。

年份 t y 年份 t y
1980 1 5.33 1993 14 5.86
1981 2 5.39 1994 15 5.9
1982 3 5.29 1995 16 5.97
1983 4 5.41 1996 17 5.49
1984 5 5.45 1997 18 6.6
1985 6 5.5 1998 19 6.64
1986 7 5.57 1999 20 6.74
1987 8 5.58 2000 21 6.87
1988 9 5.61 2001 22 7.01
1989 10 5.69 2002 23 7.19
1990 11 5.78 2003 24 7.3
1991 12 5.78 2004 25 7.44
1992 13 5.81

rm(list=ls())

# ---- 根据散点图观察在1995年(t=16)有折点,用折线回归拟合这些数据。 ----
rm(list=ls())

# ---- 根据散点图观察在1995年(t=16)有折点,用折线回归拟合这些数据。 ----
data10.4 <- read.csv('D:/rwork/应用回归/习题数据/表10-9.csv',head=TRUE)
attach(data10.4) #将该数据框添加到R的搜索路径,以便于下面直接使用数据框中的数组x和y
plot(t,y)
x = t-16 #t>16时,x=x-16;
x[x<0] = 0 #t<=16时,x=0。
lm10.4 <- lm(y~t+x,data=data10.4)
summary(lm10.4) #回归分析
anova(lm10.4) #方差分析表
# 设当t<=16时,x=0,t>16时x=t-16,得y^=5.18+0.055t+0.11x,回归系数都显著非0,折线回归成立。

detach(data10.4) #与attach()相对应,将数据框从搜索路径中移除

在这里插入图片描述




参考课本:应用回归分析(R语言版),何晓群编著

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值