论文阅读:考虑异质边际全局和局部依赖的二维保修数据分析

目录

 

摘要:

符号

 年龄×使用平面分析


1. 摘要:

This paper conducts a two-dimensional warranty analysis on the data with heterogeneity in terms of both age and usage. Two models are developed to evaluate the severity of warranty claims. The first one uses a copula to describe the global dependence between the age and usage populations, whereas the second one further captures various local dependence in different warranty regions. Since the mixing proportions regarding heterogeneity are latent, the expectation maximization algorithm is proposed to estimate parameters and classify the warranty data. The likelihood ratio test is further utilized to determine the number of subpopulations. A comparison with two other models shows the superiority of the proposed one in terms of the Akaike information criterion. It is found that more than 85% of the claims are classified into normal failures, and local dependence structures might vary from a symmetric one to an asymmetric one. Meanwhile, as the sample size decreases, the heterogeneity of usage would vanish, and some local dependence structures would change.

本文对具有异质性的数据在年龄和使用方面进行了二维保修分析。开发了两个模型来评估保修索赔的严重性。第一个使用 copula 来描述年龄和使用人群之间的全局依赖关系,而第二个进一步捕获不同保修区域的各种局部依赖关系。由于关于异质性的混合比例是潜在的,因此提出了期望最大化算法来估计参数和对保修数据进行分类。似然比检验进一步用于确定亚群的数量。与其他两种模型的比较显示了所提出的模型在 Akaike 信息标准方面的优越性。发现超过 85% 的索赔被归类为正常故障,并且局部依赖结构可能从对称结构到不对称结构变化。同时,随着样本量的减少,使用的异质性会消失,一些局部依赖结构会发生变化。

2. 符号

 3. 年龄×使用平面分析

 4. 模型

使用 copula 开发了两个模型。 考虑到具有异质性的 2D 保修,模型 I 捕获了age和 usage population之间的全局依赖性,而模型 II 使用四个 copula 函数来描述age和usage subpopulation之间的局部依赖性。

模型I

如果年龄和使用存在异质性,一个自然的想法是使用混合分布作为边缘,其依赖关系由 copula 函数建模。 然后它形成一个二维联合分布,其概率密度函数 (pdf) 根据 Sklar 定理 [31] 由下式给出

h(t1,t2)=f (t1)g(t2)c(F(t1),G(t2)) = (p1f1(t1)+p2f2(t1))(w1g1(t2)+w2g2(t2))c(p1F1(t1)+p2F2(t1),w1G1(t2) +w2G2(t2))

probability density function, pdf

cumulative distribution function, cdf

where f(t1) and g(t2)are the pdf of the age and usage respectively; 

fj(t1)(Fj(t1)) and gj(t2) (Gj(t2) ), j = 1, 2, are the pdf (cumulative distribution function, cdf) of the jth subpopulation;

c(⋅, ⋅) is the density of the copula C(⋅,⋅),

pj, wj are the mixing proportion with the constrain that Σ2j=1pj = 1 and Σ2j=1wj = 1

C is an arbitrary copula

D1 and D2 are the spaces of the subpopulations that contain weak items regarding age and usage

weak subpopulation 的后验概率

\tau _{l1}(t_{1i}; \vartheta _1) = Pr [\delta _{1i} =1|t_{1i}] =\frac{p_1f_1(t_{1i})}{p_1f_1(t_{1i})+(1-p_1)f_2(t_{1i})}

模型II

模型 II 进一步利用四个局部 copula 来捕捉这种相关性

h(t_1, t_2) = p_1w_1f_1(t_1)g_1(t_2)c(t_1, t_2) + p_1w_2f_1(t_1)g_2(t_2)c(t_1, t_2) +p_2w_1f_2(t_1)g_1(t_2)c(t_1, t_2) + p_2w_2f_2(t_1)g_2(t_2)c(t_1, t_2)

c(t_1, t_2) = c(p_1F_1(t_1) + p_2F_2(t_1), w_1G_1(t_2) + w_2G_2(t_2))

意味着所有区域的依赖结构完全相同。 为了考虑不同地区的各种相关性,考虑以下模型(模型II)

h∗(t1,t2)=p1w1f1(t1)g1(t2)c1(F1(t1),G1(t2))+p1w2f1(t1)g2(t2)c2(F1(t1),G2(t2))+ p2w1f2(t1)g1(t2)c3(F2(t1),G1(t2))+p2w2f2(t1)g2(t2)c4(F2(t1),G2(t2)) =p1w1h1∗(t1,t2)+p1w2h2∗(t1,t2)+p2w1h3∗(t1,t2)+p2w2h4∗(t1,t2).

因此,h∗(t1,t2) 是二维分布的密度函数。h_{*}(t_1, t_2) = a_1h_{1*}(t_1, t_2) + a_2h_{2*}(t_1, t_2) + a_3h_{3*}(t_1, t_2) + a_4h_{4*}(t_1, t_2)

\sum _{1}^{4}a_i=1

Copula函数——一种处理变量之间相关性的统计学工具 - 知乎

Copula系列(一)-什么是Copula函数 - 知乎

AIC和BIC准则详解_Sany 何灿的博客-CSDN博客_aic bic准则

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值