一、基础-OLS回归的矩阵推导(线性代数基础)
岭回归和lasso回归主要是用来解决多重共线性中变量选择问题。
二、 岭回归和lasso回归原理(自变量量纲一致)
三、stata进行变量筛选
3.1 岭回归参考
https://zhuanlan.zhihu.com/p/53905488https://zhuanlan.zhihu.com/p/53905488
3.2lasso回归
//电脑联网,输入
findit lassopack
// 注意:这里自变量的量纲相同都是费用,所以不用标准化,如果需要标准化,
那么可以借助Matlab的zscore函数,或者直接使用SPSS(分析-描述统计-描述:
在描述列表的方框左下角,看到“将标准化得分另存为变量(Z)之后点击打勾,然后确定。)
// Stata中也有相应的标准化变量的命令,不过一次只能标准化一个变量,
例如: egen Y = std(单产) 这个代码就表示将单产标准化,得到的变量记为Y
cvlasso 单产 种子费 化肥费 农药费 机械费 灌溉费, lopt seed(520)
四、总结