分布滞后线性和非线性模型（DLNM）分析空气污染（臭氧）、温度对死亡率时间序列数据的影响...

拓端研究室TRL

于 2022-12-02 16:16:27 发布

阅读量1.5k

点赞数 1

本文链接：https://blog.csdn.net/tecdat/article/details/128157079

版权

本文介绍了R语言中的分布滞后非线性模型（DLNM）如何用于分析时间序列数据中空气污染（如臭氧）和温度对死亡率的影响。DLNM利用交叉基灵活地描述非线性和滞后效应，通过分布滞后模型处理滞后影响。文中展示了具体的建模步骤，包括定义非线性暴露-反应关系和滞后效应，并提供了实际数据的应用示例。

摘要由CSDN通过智能技术生成

全文下载链接 http://tecdat.cn/?p=23947

分布滞后非线性模型（DLNM）表示一个建模框架，可以灵活地描述在时间序列数据中显示潜在非线性和滞后影响的关联。该方法论基于交叉基的定义，交叉基是由两组基础函数的组合表示的二维函数空间，它们分别指定了预测变量和滞后变量的关系。本文在R软件实现DLNM，然后帮助解释结果，并着重于图形表示。本文提供指定和解释DLNM的概念和实践步骤，并举例说明了对实际数据的应用（点击文末“阅读原文”获取完整代码数据）。

关键字：分布滞后模型，时间序列，平滑，滞后效应，R。

相关视频

1.简介

统计回归模型的主要目的是定义一组预测变量与结果之间的关系，然后估计相关影响。当依赖项显示某些滞后影响时，会进一步增加复杂性：在这种情况下，预测变量的发生（我们称其为暴露事件）会在远远超出事件周期的时间范围内影响结果。此步骤需要定义更复杂的模型以表征关联，并指定依赖项的时间结构。

1.1 概念框架

对滞后效应的适当统计模型的说明及其结果的解释，有助于建立适当的概念框架。这个框架的主要特点是定义了一个额外的维度来描述关联，它指定了暴露和结果之间在滞后维度上的时间依赖性。这个术语，借用了时间序列分析的文献，代表了评估影响滞后时暴露事件和结果之间的时间间隔。在长时间暴露的情况下，数据可以通过等距时间段的划分来构造，定义一系列暴露事件和结果实现。这种划分也定义了滞后单位。在这个时间结构中，暴露-反应关系可以用两种相反的观点中的任何一种来描述：我们可以说一个特定的暴露事件对未来的多个结果产生影响，或者说一个特定的结果可以用过去多个暴露事件的贡献来解释。然后，可以使用滞后的概念来描述向前（从固定结果到未来结果）或向后（从固定结果到过去的结果）的关系。

最终，滞后效应统计模型的主要特征是它们的二维结构：该关系同时在预测变量的通常空间和滞后的维度上进行描述。

1.2 分布滞后模型

最近，在评估环境压力因素的短期影响的研究中已经解决了滞后影响的问题：一些时间序列研究报告说，暴露于高水平的污染或极端温度会在其发生后的几天内持续影响健康（ Braga等，2001；Goodman等，2004；Samoli等，2009；Zanobetti和Schwartz，2008）。

给定定义的数据时间结构和简单的滞后维度定义，时间序列研究设计可提供多种优势来处理滞后影响，其中时间划分是由等间隔和有序的时间点直接指定的。在这种情况下，滞后效应可以用分布滞后模型（DLM）来优雅地描述，该模型最初是在计量经济学中开发的（Almon 1965），最近在环境因素研究中用于量化健康效应（Schwartz 2000; Zanobetti et al。2000; 2007）。Muggeo和Hajat，2009年）。通过这种方法，可以使用多个参数来解释在不同时滞下的影响，从而将单个暴露事件的影响分布在特定的时间段内，

1.3 本文目的

统计环境R提供了一组用于指定和解释DLNM结果的工具。本文的目的是提供该程序包函数的全面概述，包括函数的详细摘要以及以实际数据为例的示例。该示例涉及1987-2000年期间两个环境因素（空气污染（臭氧）和温度）对死亡率的影响。在本文中，我重新考虑了定义DLNM，预测效果并借助图形函数解释结果的主要概念和实践步骤。

2.非线性和滞后效应

在本节中，我介绍了时间序列模型的基本公式，然后介绍了描述非线性效应和滞后效应的方法，后者通过简单DLM的模型来描述。

2.1 基本模型

时间序列数据的模型通常可以表示为：

其中µt≡E（Yt），Yt是t = 1时的一系列结果...，n，假设来自指数族的分布。函数sj指定变量xj和线性预测变量之间的关系，该变量由参数向量βj定义。变量uk包含具有由相关系数γk指定的线性效应的其他预测变量

之前描述的数据说明性示例中，结果Yt是每日死亡计数，假定是泊松分布，其中E（Y）= µ，V（Y）= φµ。

臭氧和温度的非线性和滞后影响通过函数sj建模，该函数定义了预测变量和滞后变量两个维度之间的关系

2.2 非线性暴露-反应关系

DLNM开发的第一步是定义预测变量空间中的关系。通常，非线性暴露-反应依赖性通过适当的函数s在回归模型中表示。在完全参数化的方法中，提出了几种不同的函数，每个函数都具有不同的假设和灵活性。主要选择通常依赖于描述光滑曲线的函数，例如多项式或样条函数（Braga等，2001；Dominici等，2004）。关于线性阈值参数化的使用（Muggeo 2010; Daniels et al。2000）; 或通过虚拟参数化进行简单分层。

所有这些函数都对原始预测变量进行了转换，以生成包含在模型中作为线性项的一组转换变量。相关的基础函数包括原始变量x的一组完全已知的转换，这些转换生成一组称为基础变量的新变量。代数表示可以通过以下方式给出：

定义DLNM的第一步是在函数mkbasis（）中执行的，该函数用于创建基础矩阵Z。此函数的目的是提供一种通用的方式来包含x的非线性效应。举例来说，我建立了一个将所选基函数应用于向量的基矩阵：

R> mkais(1:5, tpe = "s", df = 4, egree = 2, cenvlue = 3)

最低0.47元/天解锁文章

拓端研究室TRL

关注

1
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
分布滞后线性和非线性模型（DLNM）分析空气污染（臭氧）、温度对死亡率时间序列数据的影响...

全文下载链接http://tecdat.cn/?p=23947分布滞后非线性模型（DLNM）表示一个建模框架，可以灵活地描述在时间序列数据中显示潜在非线性和滞后影响的关联。该方法论基于交叉基的定义，交叉基是由两组基础函数的组合表示的二维函数空间，它们分别指定了预测变量和滞后变量的关系。本文在R软件实现DLNM，然后帮助解释结果，并着重于图形表示。本文提供指定和解释DLNM的概念和实践步骤，并举...
复制链接

扫一扫