1
回归分析关键词
1、回归(regression):发生倒退或表现倒退;常指趋于接近或退回到中间状态。在线性回归中,回归指各个观察值都围绕、靠近估计直线的现象。
2、多元回归模型(multiple regression model):包含多个自变量的回归模型,用于分析一个因变量与多个自变量之间的关系。它与一元回归模型的区别在于,多元回归模型体现了统计控制的思想。
3、因变量(dependent variable):也称为依变量或结果变量,它随着自变量的变化而变化。从试验设计角度来讲,因变量也就是被试的反应变量,它是自变量造成的结果,是主试观测或测量的行为变量。
4、自变量(independent variable):在一项研究中被假定作为原因的变量,能够预测其他变量的值,并且在数值或属性上可以改变。
5、随机变量(random variable):即随机事件的数量表现。这种变量在不同的条件下由于偶然因素影响,可能取各种不同的值,具有不确定性和随机性,但这些取值落在某个范围的概率是一定的。
6、连续变量(continuous variable):在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值,比如身高、体重等。
7、名义变量(nominal variable):本身的编码不包含任何具有实际意义的数量关系,变量值之间不存在大小、加减或乘除的运算关系。
8、截距(intercept):函数与y坐标轴的相交点,即回归方程中的常数项。
9、斜率(slope):即回归方程中各自变量的系数。它表示自变量一个单位的变化所引起的因变量的变化量,如果是线性模型,则在坐标图上表现为两个变量拟合直线之斜率。
10、偏效应(partial effect):在控制其他变量的情况下,或者说在其他条件相同的情况下,各自变量X对因变量Y的净效应(net effect)或独特效应(unique effect)。
11、效应幅度(size of effect):指反映变量作用大小的具体数值。一个变量的系数可能在统计上显著地区别于0,但是该系数的值却不大,即效应幅度很小,从而不具有很大的实质性意义。
12、拟合优度(goodness of fit):指回归模型对观察数据的概括拟合程度,反映的是模型的效率,即模型在多大程度上解释了因变量的变化。
13、误差(error):指可以避免或不可避免的观测值和真实值之间的差。
14、预测值(predicted values):通过根据估计的回归模型代入解释变量观察值后计算得到的因变量值。
15、总平方和(sum of squares total):即因变量观察值与其平均值的离差平方和,是需要解释的因变量的变异总量。
16、残差平方和(sum of squares error):因变量观察值与对应的回归模型预测值的离差平方和。是观察值落在回归线(面)之外而引起的,是模型中各自变量对因变量线性影响之外的其他因素对因变量总平方和的影响。
17、回归平方和(sum of squares regression):通过回归模型计算得到的因变量预测值与因变量观察值的均值的离差平方和。这是由自变量变化引起的,是回归模型所解释的部分。
18、均方(mean square):离差平方和除以相应的自由度即可得到均方。在回归分析中,