matlab神经网络43个案例分析_回归分析不可不知的 43 个关键词

今天,小编给大家选取了在学习线性OLS回归分析中不可不知的43个关键词。快来看看你还记得多少吧!

  1. 回归(regression):发生倒退或表现倒退;常指趋于接近或退回到中间状态。在线性回归中,回归指各个观察值都围绕、靠近估计直线的现象。

  2. 多元回归模型(multiple regression model):包含多个自变量的回归模型,用于分析一个因变量与多个自变量之间的关系。它与一元回归模型的区别在于,多元回归模型体现了统计控制的思想。

  3. 因变量(dependent variable):也称为依变量或结果变量,它随着自变量的变化而变化。从试验设计角度来讲,因变量也就是被试的反应变量,它是自变量造成的结果,是主试观测或测量的行为变量。

  4. 自变量(independent variable):在一项研究中被假定作为原因的变量,能够预测其他变量的值,并且在数值或属性上可以改变。

  5. 随机变量(random variable):即随机事件的数量表现。这种变量在不同的条件下由于偶然因素影响,可能取各种不同的值,具有不确定性和随机性,但这些取值落在某个范围的概率是一定的。

  6. 连续变量(continuous variable):在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值,比如身高、体重等。

  7. 名义变量(nominal variable):本身的编码不包含任何具有实际意义的数量关系,变量值之间不存在大小、加减或乘除的运算关系。

  8. 截距(intercept):函数与y坐标轴的相交点,即回归方程中的常数项。

  9. 斜率(slope):即回归方程中各自变量的系数。它表示自变量一个单位的变化所引起的因变量的变化量,如果是线性模型,则在坐标图上表现为两个变量拟合直线之斜率。

  10. 偏效应(partial effect):在控制其他变量的情况下,或者说在其他条件相同的情况下,各自变量X对因变量Y的净效应(net effect)或独特效应(unique effect)。

  11. 效应幅度(size of effect):指反映变量作用大小的具体数值。一个变量的系数可能在统计上显著地区别于0,但是该系数的值却不大,即效应幅度很小,从而不具有很大的实质性意义。

  12. 拟合优度(goodness of fit):指回归模型对观察数据的概括拟合程度,反映的是模型的效率,即模型在多大程度上解释了因变量的变化。

  13. 误差(error):指可以避免或不可避免的观测值和真实值之间的差。

  14. 预测值(predicted values):通过根据估计的回归模型代入解释变量观察值后计算得到的因变量值。

  15. 总平方和(sum of squares total):即因变量观察值与其平均值的离差平方和,是需要解释的因变量的变异总量。

  16. 残差平方和(sum of squares error):因变量观察值与对应的回归模型预测值的离差平方和。是观察值落在回归线(面)之外而引起的,是模型中各自变量对因变量线性影响之外的其他因素对因变量总平方和的影响。

  17. 回归平方和(sum of squares regression):通过回归模型计算得到的因变量预测值与因变量观察值的均值的离差平方和。这是由自变量变化引起的,是回归模型所解释的部分。

  18. 均方(mean square):离差平方和除以相应的自由度即可得到均方。在回归分析中,研究者感兴趣的是回归均方(mean square regression,简写为MSR)和均方误(mean square error,简写为MSE)。

  19. 判定系数(coefficient of determination):回归平方和占总平方和的比例,记为R2。通常把它理解为回归方程解释掉的平方和占其总平方和的比例。判定系数被用来作为对方程拟合优度进行测量的指标,取值在[0,1]之间,值越大表明回归方程的解释能力越强。

  20. 判定系数增量(increamental R2):在原有回归模型基础上,通过加入新的自变量所带来的判定系数的增加量。

  21. 嵌套模型(nested models):如果一个模型(模型一)中的自变量为另一个模型(模型二)中自变量的子集或子集的线性组合,我们就称这两个模型是嵌套模型。模型一称为限制性模型(restricted model),模型二称为非限制性模型(unrestricted model)。限制性模型嵌套于非限制性模型中。

  22. 虚拟编码(dummy coding):依据名义变量各类别对其进行重新编码从而令其能够作为自变量纳入回归方程的编码方式。对于一个包含J个类别的名义变量,理论上可以得到J个取值为0或1的虚拟变量,但在回归分析中,通常只建构J-1个虚拟变量”。每一虚拟变量对应着原名义变量的一个类别,如果属于该类别则虚拟变量取值为1,否则取值为0。

  23. 虚拟变量(dummy variable):也称作指示变量(indicator),取值为0或1的变量,故也被称作0-1变量。

  24. 二分变量(dichotomous variable):即只有两种可能取值的变量,如性别。

  25. 参照组(reference group):被排除出回归模型的那个虚拟变量所对应的类别,亦即所有虚拟变量取值全部为零的类别。

  26. 交互项(interaction term):在操作上,交互项就是两个或多个(一般不多于三个)自变量的乘积。在回归模型中引入交互项后,参与构造交互项的各自变量对因变量的作用依赖于交互项中其他自变量的取值。

  27. 交互效应(interaction effect):也称为调节效应或条件效应,指一个自变量对因变量的效应依赖于另一个自变量的取值。回归分析中通常设定相应的交互项来探究某个自变量的条件效应。

  28. 常规最小二乘法(ordinaryleast squares,OLS):线性回归中求解参数的常用方法。该方法的基本思路为:根据从总体中随机抽出的一个样本,在平面直角坐标系中找到一条直线,使得观测值和拟合值之间的距离最短,即两者之间残差的平方和最小。

  29. 线性(linearity):指自变量与因变量之间的关系为单调的一次函数关系,因变量取值随着自变量而变化的速率不随自变量取值的大小不同而存在差异。另外,线性也指回归分析中因变量为各回归系数的线性组合。

  30. 无偏性(unbiasedness):当样本统计量的期望值等于总体真值时,该统计量具有无偏性。无偏性是选择估计量的首要标准。

  31. 偏误(bias):统计估计中的估计值和真实值之间的差。

  32. 忽略变量偏误(omitted variable bias):回归模型设定中,由于忽略了某些本该纳入却未纳入的相关自变量,而该自变量又与模型中其他自变量存在相关,导致回归参数估计值存在一定的误差,则这一误差被称作忽略变量偏误。偏误的方向取决于被忽略变量对因变量效应的方向以及该自变量与已纳入模型中自变量之间关系的方向;而偏误的大小则直接取决于该忽略自变量对因变量的效应的大小以及与模型中其他自变量之间的相关关系的强弱,它们之间的相关性越强,则忽略变量偏误越大。

  33. 相关条件(correlation condition):判断回归模型中存在忽略变量偏误的条件之一,指的是被忽略的自变量与已纳入模型中的关键自变量之间相关。

  34. 有关条件(relevance condition):判断回归模型中存在忽略变量偏误的条件之一,指的是被忽略的自变量会影响因变量。

  35. 有效性(efficiency):对总体参数进行估计时,在所有可能得到的无偏估计量中,抽样分布方差最小的无偏估计量,就具有有效性,是选择估计量的另一个标准。

  36. 独立同分布假定(assumption ofindependent identical distributed errors):或称i.i.d.假定,假定一般线性模型中的随机误差项独立(彼此独立且独立于自变量)并且服从零均值等方差的同质性分布。

  37. 一致性(consistency):是选择估计量的第三个标准。一致性表达的是,估计量以概率方式收敛于参数真值。

  38. 最佳线性无偏估计(best linear unbiasedestimator):在满足所需假定条件的情况下,回归参数的常规最小二乘估计是所有无偏线性估计中方差最小的,因此,将其称作最佳线性无偏估计。 

  39. 近似多重共线性(approximatemulticollinearity):当数据矩阵中一个或几个自变量列向量可以近似表示成其他自变量列向量的线性组合时,就会出现近似多重共线性问题。此时,模型仍是可以估计的,只是参数估计值的标准误过大,从而会造成统计检验和推论的不可靠。

  40. 完全多重共线性(perfectmulticollinearity):当数据矩阵中一个或几个自变量列向量可以表示成其他自变量列向量的线性组合时,自变量矩阵X’X会严格不可逆,就出现了完全多重共线性。当发生完全多重共线性时,直接导致模型参数无解,即出现模型识别问题。

  41. 复相关系数(multiple correlation coefficient):度量复相关程度的指标。它是一个变量同时与数个变量之间的相关程度,可利用单相关系数和偏相关系数求得。复相关系数越大,表明变量之间的线性相关程度越高。

  42. 容许度(tolerance):回归分析中反映自变量之间存在多重共线性程度的统计量之一。对每一个变量,定义容许度为1减去模型中其他自变量之间的复相关系数。显然,当容许度越小,越接近0时,多重共线性就越严重。当容许度严格等于0时,也就是复相关系数严格等于1时,就意味着完全多重共线性的存在。

  43. 方差膨胀因子(variance inflation factor):回归分析中反映自变量之间存在多重共线性程度的统计量之一,它等于容许度的倒数。对于某个自变量,其方差膨胀因子可定义为容许度的倒数。

除了上述这些关键词,你还总结得出回归分析中涉及的其他关键词吗?

文章来源统计课是纸老虎。词汇表内容取自《回归分析》(谢宇,2010)

快到碗里来

!

43a55ee357d40d16ba80f9d78d5acc86.png 45962cf0f1eaea95abf4e5d40e2edfbc.png 6e646f8ac4764633028be335e1341763.png
MATLAB神经网络43案例分析源代码&数据 《MATLAB 神经网络43案例分析》目录 第1章 BP神经网络的数据分类——语音特征信号分类 第2章 BP神经网络的非线性系统建模——非线性函数拟合 第3章 遗传算法优化BP神经网络——非线性函数拟合 第4章 神经网络遗传算法函数极值寻优——非线性函数极值寻优 第5章 基于BP_Adaboost的强分类器设计——公司财务预警建模 第6章 PID神经元网络解耦控制算法——多变量系统控制 第7章 RBF网络的回归--非线性函数回归的实现 第8章 GRNN网络的预测----基于广义回归神经网络的货运量预测 第9章 离散Hopfield神经网络的联想记忆——数字识别 第10章 离散Hopfield神经网络的分类——高校科研能力评价 第11章 连续Hopfield神经网络的优化——旅行商问题优化计算 第12章 初始SVM分类与回归 第13章 LIBSVM参数实例详解 第14章 基于SVM的数据分类预测——意大利葡萄酒种类识别 第15章 SVM的参数优化——如何更好的提升分类器的性能 第16章 基于SVM的回归预测分析——上证指数开盘指数预测. 第17章 基于SVM的信息粒化时序回归预测——上证指数开盘指数变化趋势和变化空间预测 第18章 基于SVM的图像分割-真彩色图像分割 第19章 基于SVM的手写字体识别 第20章 LIBSVM-FarutoUltimate工具箱及GUI版本介绍与使用 第21章 自组织竞争网络在模式分类中的应用—患者癌症发病预测 第22章 SOM神经网络的数据分类--柴油机故障诊断 第23章 Elman神经网络的数据预测----电力负荷预测模型研究 第24章 概率神经网络的分类预测--基于PNN的变压器故障诊断 第25章 基于MIV的神经网络变量筛选----基于BP神经网络的变量筛选 第26章 LVQ神经网络的分类——乳腺肿瘤诊断 第27章 LVQ神经网络的预测——人脸朝向识别 第28章 决策树分类器的应用研究——乳腺癌诊断 第29章 极限学习机在回归拟合及分类问题中的应用研究——对比实验 第30章 基于随机森林思想的组合分类器设计——乳腺癌诊断 第31章 思维进化算法优化BP神经网络——非线性函数拟合 第32章 小波神经网络的时间序列预测——短时交通流量预测 第33章 模糊神经网络的预测算法——嘉陵江水质评价 第34章 广义神经网络的聚类算法——网络入侵聚类 第35章 粒子群优化算法的寻优算法——非线性函数极值寻优 第36章 遗传算法优化计算——建模自变量降维 第37章 基于灰色神经网络的预测算法研究——订单需求预测 第38章 基于Kohonen网络的聚类算法——网络入侵聚类 第39章 神经网络GUI的实现——基于GUI的神经网络拟合、模式识别、聚类 第40章 动态神经网络时间序列预测研究——基于MATLAB的NARX实现 第41章 定制神经网络的实现——神经网络的个性化建模与仿真 第42章 并行运算与神经网络——基于CPU/GPU的并行神经网络运算 第43神经网络高效编程技巧——基于MATLAB R2012b新版本特性的探讨
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值