门限回归模型的实际应用分析

目录

一、引言

门限回归模型

二、数据准备

三、数据预处理

四、门限回归分析

五、结果解读

六、稳健性检验

七、进一步分析

八、结论


一、引言

门限回归模型作为一种强大的统计工具,能够捕捉到变量之间的非线性关系,在经济、金融、社会科学等领域有着广泛的应用。本文将以研究个人收入与教育程度和工作年限之间的关系为例,详细介绍门限回归模型的分析过程。

门限回归模型

门限回归模型(Threshold Regressive Model,简称 TR 模型或 TRM)的基本思想是通过门限变量的控制作用,当给出预报因子资料后,根据门限变量的门限阈值的判别控制,来决定不同情况下使用不同的预报方程,从而试图解释各种类似于跳跃和突变的现象。

其实质是把预报问题按状态空间的取值进行分类,用分段的线性回归模式来描述总体非线性预报问题。其一般形式如下:

  1. 读取数据,计算预报对象与预报因子之间的互相关系数矩阵。
  2. 对相关系数进行排序,相关系数最大的因子可作为门限元。
  3. 估计门限值。通过最小化残差平方和等方法来确定最优的门限值,使得不同区间内的回归方程能够更好地拟合数据。
  4. 进行回归分析。在确定门限值后,针对不同区间的数据分别进行线性回归,得到相应的回归系数。
  5. 模型检验。对建立的门限回归模型进行检验,如检验回归系数的显著性、模型的整体拟合优度等。

门限回归模型具有以下特点和优势:

  1. 能够捕捉到经济、金融等领域中常见的非线性关系,例如经济变量在不同阶段的变化趋势可能不同。
  2. 门限变量的选择可以由理论模型外生决定,具有一定的灵活性。
  3. 不需要事先给定非线性方程的具体形式,门限值及其个数完全由样本数据内生决定。
  4. 提供了渐近分布理论来建立待估参数的置信区间,还可运用自助法(bootstrap)来估计门限值的统计显著性。

在实际应用中,门限回归模型能够解释金融数据中经常表现出来的一些非线性性质,如周期性和不对称性、波动的聚集性、波动的跳跃现象和时间的不可逆性等。与多元线性回归、模糊分析和灰色模型等预测模型相比,TAR 模型具有预测精度高且稳健、应用简便的特点,近年来在经济方面得到了广泛的应用。例如,可以研究在不同经济发展水平、企业规模或其他条件下,某些经济变量之间的关系如何发生变化;或者探讨在不同市场状态下,资产价格的决定因素等。

然而,门限回归模型也存在一些局限性。例如,门限变量的选择可能具有一定的主观性;在样本量较小时,门限值的估计可能不够准确;模型的解释和经济含义的解读可能相对复杂等。在使用门限回归模型时,需要结合具体问题和数据特点进行合理的分析和应用。同时,为了确保模型的可靠性和有效性,通常需要进行充分的模型检验和诊断。

二、数据准备

假设我们有一个名为 income.dta 的数据集,其中包含变量 income(个人收入)、education(教育程度)、work_years(工作年限)以及一些可能的控制变量,如 gender(性别)和 industry(所在行业)。

use "income.dta", clear

三、数据预处理

  1. 检查数据的完整性和合理性,查看是否有缺失值。

mdesc income education work_years gender industry

  1. 对连续变量进行标准化处理,以便更好地比较回归系数的大小。

egen std_income = std(income)
egen std_education = std(education)
egen std_work_years = std(work_years)

四、门限回归分析

安装所需的命令

ssc install threg

进行单门限回归分析

threg std_income std_education, thvar(std_work_years) grid(200)

解释:

  • grid(200) 表示在搜索门限值时使用 200 个网格点,以更精确地找到最优门限值。

进行双门限回归分析(如果需要)

threg std_income std_education, thvar(std_work_years) dthresh(2) grid(200)

解释:

  • dthresh(2) 表示进行双门限回归分析。

五、结果解读

  1. 门限值的估计结果
    查看门限值的估计值及其置信区间。例如,单门限回归可能得到工作年限的门限值为 8 年(95%置信区间:[7, 9])。

  2. 不同门限区间内回归系数的估计值
    分析在不同工作年限区间内,教育程度对个人收入的影响程度。假设在工作年限小于 8 年时,教育程度的回归系数为 0.5;工作年限大于 8 年时,回归系数为 0.8。

  3. 统计检验结果

  • 检验门限值是否显著。如果 p 值小于 0.05,则表明门限值是显著的。
  • 检验回归系数的显著性。显著的回归系数意味着该变量对个人收入有显著影响。

六、稳健性检验

  1. 改变门限变量
    尝试使用其他可能的变量作为门限变量,如性别或行业,观察结果是否稳定。

  2. 改变样本范围
    例如,只考虑特定年龄段(如 25 - 45 岁)或特定行业(如金融行业)的样本,重新进行门限回归分析。

七、进一步分析

  1. 比较不同门限区间的样本特征
    例如,计算不同区间内样本的平均收入、教育程度等统计量。发现工作年限小于 8 年的样本平均收入为 5000 元,教育程度平均为 12 年;工作年限大于 8 年的样本平均收入为 8000 元,教育程度平均为 15 年。

  2. 引入交互项
    可以考虑引入门限变量与解释变量的交互项,以更细致地研究非线性关系。

八、结论

通过以上全面的分析,我们能够更深入地理解个人收入与教育程度、工作年限之间的非线性关系。门限回归模型为我们揭示了在不同条件下变量之间的复杂作用机制,为相关政策制定和决策提供了有力的依据。

需要注意的是,在实际应用中,应根据具体问题和数据特点灵活运用门限回归模型,并结合其他分析方法进行综合判断。

门限回归及Stata操作汇总与空间门槛回归模型简介 (qq.com)icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=MzAwMjkyMTEyMg==&mid=2247487834&idx=1&sn=7d11c9eaf1b123c8da8386212c03e130&chksm=9ac25697adb5df8128e9c814d3d87b833f7218e71b4ec31e7aad64980572d0ff36e3a89d703d#rd1996-2019年各省废水污染、治理数据icon-default.png?t=N7T8https://download.csdn.net/download/a519573917/89485042

  • 22
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值