这是我根据Applied Econometrics with R(springer)一书中线性回归(第三章)有关内容整理成的学习笔记,对书中的一些代码进行了解读,也根据我学到的回归知识添加了部分内容。笔记中的例子凡是书上给出过输出结果的,在这里一律省略,没给出结果的,附上结果及函数解读。这个并不是书内容的翻译,与原书有一定的出入。
Chapter 3:线性模型
需要加载函数包: AER
章节目录
3.1 简单线性模型
3.2 多变量线性模型
3.3 半线性模型
3.4 因子、交互作用、加权最小二乘
3.5 时间序列的回归
3.6 面板数据的回归
3.7 线性方程组
3.1 简单线性模型
例1:一元线性模型
数据集: journals
模型 log(subs)=β1+β2*log(citeprice)+ e
使用代码:
1) 了解数据集的基本情况
library(AER)
data("Journals")
journals <- Journals[, c("subs","price")]
journals$citeprice <- Journals$price/Journals$citations#定义新变量citeprice
summary(journals)
对数据进行基本的了解,在Hmisc,psych包中的describe函数提供了诸如离差,极差,峰度,偏度,数据量,缺失数等诸多统计量的统计结果,运行以下代码:
library(psych)
describe(journals)
输出结果:
判断数据是否具有一定的线性性,我们可以使用最直观的办法画图来做初步判断,代码如下:
plot(log(subs) ~ log(citeprice),data = journals)
jour_lm <- lm(log(subs) ~log(citeprice), data = journals)
abline(jour_lm)
可以得到图3.1,据此可初步判断数据间具有相关性,当然cor.test()也可以做到这一点,运行cor.test(journals$subs,journals$citeprice),有以下结果:
Pearson'sproduct-moment correlation
data: journals$subs and journals$citeprice
t = -6.1661, df = 178 , p-value = 4.57e-09
alternative hypothesis: truecorrelation is not equal to 0
95 percent confidenceinterval: -0.5330837 -0.2911326
sample estimates: cor : -0.4195314
2) 线性回归模型建立
jour_lm <-lm(log(subs) ~ log(citeprice), data = journals)
回归模型的大部分结果都可以通过summary函数进行查看,运行summary(jour_lm)即可,也有一些函数供你查看模型的特定部分
函数 |
描述 |
Summary |
标准回归结果输出 </ |