模型为Y=B1+B2X+u
Y—平均小时工资
X—读书年数
import statsmodels.api as sm
Y=[4.4567,5.77,5.9787,7.3317,7.3182,6.5844,7.8182,7.8351,11.0223,10.6738,10.8361,13.615,13.531]
X=[6,7,8,9,10,11,12,13,14,15,16,17,18]
X1=sm.add_constant(X)#在X前加上一列常数1,方便做带截距项的回归
model = sm.OLS(Y,X1)
results = model.fit()
print(results.params)
print(results.summary())
得到回归方程Y=-0.0145+0.7241X
说明读书年数每增加一个单位,平均小时工资增加0.7241个单位,截距项没有实际意义。
输出结果如下:
样本容量n=13