Quantile Regression(分位数回归)
回归是定量建模中广泛使用的一种统计方法。多元线性回归是一种基本和标准的方法,研究人员使用几个变量的值来解释或预测一个量的结果的平均值。然而,在许多情况下,我们更感兴趣的是中位数,或量表结果的任意分位数
分位数回归建模一组预测变量(独立变量)和目标变量(因变量)的特定百分位数(或“分位数”)之间的关系,通常是中位数。与普通最小二乘回归相比,它有两个主要优势:
—分位数回归对目标变量的分布没有任何假设。
—分位数回归倾向于抵制异常观测的影响
分位数回归被广泛应用于生态学、医疗保健和金融经济学等行业的研究。
Example(举例)
家庭总收入和花在食物上的收入比例之间有什么关系?
恩格尔定律是经济学中的一种观察,它指出,随着收入的增加,花在食品上的收入比例会下降,即使食品的绝对支出增加了。
对这些数据应用分位数回归,可以确定当对平均食品支出不感兴趣时,哪些食品支出可以覆盖90%的家庭(对于100个给定收入的家庭)。
Statistics(数据分析方式)
分位数回归,单纯形法,Frisch-Newton内点非线性优化算法,Barrodale and Roberts,Bofinger,Hall Sheather,带宽,显著性水平,矩阵操作,收敛准则,回归权重,截取项,预测目标,预测残差,制表,预测曲线图,参数估计,协方差矩阵,相关矩阵,观测值,置信区间
Quantile Regression data considerations(分位数回归数据注意事项)
Data(数据)
需要单个数字依赖变量。
目标变量需要是连续变量。
预测值可以是连续变量,也可以是分类预测值的虚拟变量。
运行分析需要截取项或至少一个预测器。
Assumptions(假设)
分位数回归不对目标变量的分布做出假设,并能抵抗异常观测的影响。
Related procedures(相关程序)
分位数分析与普通最小二乘回归有关。
Obtaining a Quantile Regression analysis(获得分位数回归分析)
此功能需要自定义表和高级统计信息
-
从菜单中选择
变量对话框允许您指定用于分位数回归分析的目标变量、因子变量、协变量和权重变量。
该对话框还提供了为复杂分析或大型数据集节省内存的选项 -
选择一个数值目标变量,运行分析只需要一个目标变量,只允许使用数值变量。
-
(可选)选择一个或多个因素变量。不允许使用比例变量。
-
或者,选择一个或多个协变量。不允许使用字符串变量
注意:如果因子和协变量列表均为空,并且在模型对话框上选择了在模型中包括截取,则会显示以下消息:
No effects have been specified. Therefore, an intercept only model will be fit.
Do you want to fit an intercept-only model?
- (可选)选择回归权重变量,不允许使用字符串变量。
- (可选)为复杂分析或大型数据集选择节约内存,此设置控制在处理过程中是否将数据保存在外部文件中,启用该设置有助于在运行复杂分析或具有大型数据集的分析时节省内存资源。
Quantile Regression: Criteria(分位数回归:标准)
此功能需要自定义表和高级统计信息。
Criteria(条件)对话框提供以下选项:
Quantile(<统计>分位数
提供用于指定分位数的选项。
Specify single quantiles(指定单个分位数)
选中后,至少需要一个值才能运行分析,允许多个值,并且每个值必须属于。您可以指定多个值,每个值以空格(或多个空格)分隔。使用添加、更改和删除按钮处理分位数值列表中的值。[0,1]
所有值都必须是唯一的(不允许重复值)。默认值为.0.5
Specify grid quantiles(指定格网分位数)
选中后,可以指定从起始值()到终止值()的分位数网格,增量为by()。如果指定,则只允许使用一组有效的[]。它必须满足这一点。在这种情况下,它等效于指定单个
Estimation Method(估算方法)
提供用于指定模型估计方法的选项。
Automatically chosen by the program(由程序自动选择)
允许程序自动选择适当的估算方法,这是默认设置。
Simplex algorithm
调用由Barrodale和Roberts开发的单纯形算法
Frisch-Newton interior-point non-linear optimization(Frisch-Newton内点非线性优化)
提出了Frisch-Newton内点非线性优化算法。
Post-estimation(事后估计)
提供参数估计的方差-协方差以及预测目标值的置信区间的后估计选项。
Assume cases are IID(假设案例为IID)
选中后,此设置假定误差项独立且相同地分布。如果未选择该设置,大型模型的计算时间可能会显著增加。默认情况下,该设置处于选中状态。
Bandwidth type()
确定使用哪种带宽方法来估计参数估计的方差-协方差矩阵(Bofinger或Hall-Sheather)。Bofinger是默认设置。
Numerical Method(数值方法)
提供以下选项:
Singularity tolerance(奇点容差):
指定内点法中矩阵操作的公差值。指定的值必须是(0,10-3)中的单、双精度值,默认设置为10-12。
Convergence(汇集 / 相交 / 收敛 / 集合):
指定数值方法的收敛标准。指定的值必须是(0,10-3)中的单、双精度值,默认设置为10-6。
Maximum iterations(最大迭代次数)
指定最大迭代次数。指定的值必须是单个正整数。默认值为2000。
Missing Values(缺少值)
提供用于确定如何处理缺少值的选项。
Exclude both user-missing and system missing values(同时排除缺少用户的值和缺少系统的值)
选中后,将排除缺少用户和缺少系统的值。
User-missing values are treated as valid(缺少用户的值被视为有效)
选中后,缺少用户的值将被视为有效。
Confidence interval (%)(<统计>置信区间)
指定重要性级别。指定时,该值必须是介于0和100之间的单个双精度值。默认值为95。
Quantile Regression: Model(分位数回归:模型)
此功能需要自定义表和高级统计信息。
模型对话框提供了用于指定模型中使用的效果和权重的选项。如果省略或自行指定,模型将包含截取项和所有主效应以及协变量列表中的协变量和因子列表中的因子。
Specify Model Effects(指定模型效果)
默认模型是仅截取的,因此您必须显式指定其他模型效果。或者,您可以构建嵌套或非嵌套术语。选择“生成术语”后,以下效果和交互选项可用于非嵌套术语。
Main effects (主要效果)
为每个选定的变量创建主效果项。
Interaction (相互作用 / 相互影响 / <物理>交互作用)
为所有选定变量创建最高级别的交互术语。
Factorial (<数>因子的 / 阶乘的,析因的)
创建选定变量的所有可能的交互作用和主要效果。
All 2-way
创建选定变量的所有可能的双向交互。
All 3-way
创建选定变量的所有可能的三向交互。
All 4-way
创建选定变量的所有可能的四向交互。
All 5-way
创建选定变量的所有可能的五向交互。
选择“构建嵌套术语”后,您可以构建嵌套术语。嵌套术语对于对其值不与另一个因素的水平交互的因素或协变量的影响进行建模非常有用。例如,一家食品杂货店连锁店可能会遵循其顾客在几个商店地点的消费习惯。由于每个客户只经常光顾这些位置中的一个,因此可以说客户效应嵌套在商店位置效应中。
此外,您可以包括交互效应,例如涉及相同协变量的多项式项,或者向嵌套项添加多层嵌套。