数据的生成
library("tidyverse") #利用tidyverse包
N = 1000 #数据的长度
df = tibble(id = 1:N,
x0 = rep(1), #第一列全为常数1
x1 = rnorm(N,0,1), #x1属于(0,1)的正态分布
x2 = rnorm(N,0,1), #x2属于(0,1)的正态分布
epsilon = rnorm(N,0,1), #epsilon属于(0,1)的正态分布
y = 5 + 2 * x1 - x2 + epsilon #式子
)
先利用编程自己生成的数据来进行实验
【x1、x2,epsilon均是独立同分布,符合高斯马尔可夫定理,可以使用OLS】
存储生成的数据
write.csv(df,file="D:/DATA/R/data_csv/data.csv")
# df 为 tibble's name
#file="地址根据自己存储的地方写"
导入观测值的数据也是同样的操作
windows系统复制地址时可能会报错
Error: '\D' is an unrecognized escape in character string starting ""D:\D"
将“ \ ” 在代码中改为 “ / ”即可