我用Statsmodels生成了一个OLS线性回归模型来预测一个基于10个自变量的因变量。自变量都是范畴变量。在
我有兴趣更深入地研究其中一个自变量的系数的意义。有4个类别,所以有3个系数——每一个都是非常显著的。我还想看看这一趋势在所有三个类别中的重要性。根据我(有限)的理解,这通常是通过Wald检验并将所有系数与0进行比较来完成的。在
如何使用Statsmodels实现这一点?我看到OLS函数有一个Wald测试方法。在使用这种方法时,似乎必须传入所有系数的值。在
我的方法是。。。在
首先,所有系数如下:np.array(lm.params) = array([ 0.21538725, 0.05675108, 0.05020252, 0.08112228, 0.00074715,
0.03886747, 0.00981819, 0.19907263, 0.13962354, 0.0491201 ,
-0.00531318, 0.00242845, -0.0097336 , -0.00143791, -0.01939182,
-0.02676771, 0.01649944, 0.01240742, -0.00245309, 0.00757727,
0.00655152, -0.02895381, -0.02027537, 0.02621716, 0.00783884,
0.05065323, 0.04264466, -0.13068456, -0.15694931, -0.25518566,
-0.0308599 , -0.00558183, 0.02990139, 0.02433505, -0.01582824,
-0.00027538, 0.03170669, 0.01130944, 0.02631403])
我只对参数2-4感兴趣(这是3个感兴趣的系数)。在
^{pr2}$
检查以确保此操