相对重要性分析
各个系数大小是不能被用来直接比较的。
逐步回归法:回归中逐步引入解释变量以及显著性测试。
重要性分析 (Dominance Analysis) :确定线性回归中,不同解释变量对决定系数 R2的贡献程度。
stata domin 命令
ssc intsall domin,replace //安装
domin depvar indepvars [if] [in] [weight],sets((varlist) (varlist) ...)
depvar:因变量
indepvars:解释变量
sets((varlist)(varlist)) 设定会将被列入 varlist 的变量视作一个解释变量。例如 sets((x1 x2)(x3 x4)) 表示会创建 2 个变量集合 (set)。其中 set1 由变量 x1 和变量 x2 创立,而 set2 则由变量 x3 和变量 x4 创立。该命令通常由于进行分组分析。
举例:
//用 Stata 自带的范例数据 auto.dta 来演示
sysuse "auto.dta", clear
pwcorr price weight length //相关系数
reg price weight length
domin price weight length //结果如下图
Overall Fit Statistic 的数值与运行 reg命令后的 R-squared 数值相同。这是因为 domin 命令默认的拟合优度统计量即为 R-squared.
变量 weight 对拟合优度 的边际贡献为0.2256。
变量 length对拟合优度 的边际贡献为 0.1220。
在该线性回归中,变量 weight 相对于变量 length 更加重要,对被解释变量 price 的方差的变化的解释力度更强。
//多变量
sysuse "nlsw88.dta", clear
reg wage age hours tenure married
domin wage age hours tenure married
//分组分析
domin wage age hours tenure married, ///
sets((i.occupation) (i.industry) (i.race))
在处理中将 set1,set2,set3 分别视作由 occupation ,industry 和 race产生的三个解释变量。
set1 > set2 > tenure > hours > set3 > married > age