平均超出量函数与T年重现水平-----极值理论的学习2

最新推荐文章于 2021-11-21 19:16:44 发布

杜小甫_cloverd

最新推荐文章于 2021-11-21 19:16:44 发布

阅读量3.1k

点赞数 7

本文链接：https://blog.csdn.net/qq_36713450/article/details/86503932

版权

看《实用极值统计方法》--史道济所得。

前言

用GEV（广义极值分布）模型对实际数据进行建模时，一般按以下步骤进行：将观测值序列 $x_{1},x_{2},\cdot \cdot \cdot x_{n}$ 平均分为长度为m的k个组，每个组中选取最大值记为 $z$ ，那么 $z_{1},z_{2},\cdot \cdot \cdot z_{k}$ 就是每个组的最大值组成的序列。只要 $m$ 够大， $z_{1},z_{2},\cdot \cdot \cdot z_{k}$ 就可以近似地看成时来自GEV分布 $H(x;\mu,\delta,\varepsilon )$ 的一个独立同分布观测。但是这种方法有时会造成数据信息的浪费。比如某些组内可能包含更多的极值信息。因此，为了充分地利用数据中的极值信息，应该考虑数据中超过某个阈值 $\mu$ 的所有数据，并利用这些数据进行建模。

一、平均超出量函数

设 $X_{1},X_{2},\cdot \cdot \cdot X_{n}$ 为独立同分布的随机变量序列，分布函数支撑的上端点为 $x^{*}$ ，对某固定的大值 $\mu < x^{*}$ ，称为阈值。若 $X_{i}>\mu$ ，则称它为超阈值，称 $X_{i}-\mu$ 为超出量，那么

$F_{\mu}(x)=P_{r}(X-\mu<x|X>\mu)=\frac{F(x+\mu)-F(x)}{1-F(\mu)},x\geq 0$

称 $F_{\mu}(x)$ 为随机变量X（或分布函数F)的超过阈值 $\mu$ 的超出量的分布函数，简称超出量分布。对应的密度函数为

$f_{\mu}(x)=\frac{f(x+\mu)}{1-F(\mu)},x\geq 0$

而随机变量X（或分布函数F）的超阈值分布函数为：

$F_{[\mu]}(x)=P_{r}(X\leq x|X>\mu)=\frac{F(x)-F(\mu)}{1-F(\mu)},x\geq \mu$ ,

对应的密度函数为

$f_{[\mu]}(x)=\frac{f(x)}{1-F(x)},x\geq \mu$

X的平均超出量函数 $e(\mu)=E(X-\mu|X>\mu)=\int_{x_*}^{x^*}xf_u(x)d_x$ 。

在极值分析中，有时也关心超过阈值的观测个数。设 $X_{1},X_{2},\cdot \cdot \cdot X_{n}$ 为独立同分布的随机变量序列，且底分布函数F，K表示数据集中超过 $\mu$ 的个数，那么：

$P_{r}(K=k)=\binom{n}{k}p^k(1-p)^{n-k},k=0,1,\cdot \cdot \cdot n$

其中 $p=1-F(\mu)$ ，所以，超过阈值的平均超阈值个数为：

$E(K)=np=n(1-F(\mu))$

二、重现水平

机制分析的主要目的之一是估计分位数 $x_{p}$ 。现把 $x_{p}$ 作为阈值 $\mu(T)$ ，设 $X_{1},X_{2},\cdot \cdot \cdot X_{n}$ 是独立同分布随机变量，底分布为F，对某个阈值 $\mu$ ，考虑超阈值事件 $\{X_{i}>\mu\}$ ，要求每年只有一个观测值， $X_{i}$ 为第i年的观测，那么所谓T年重现水平 $\mu(T)$ 就是要求在T年内超过阈值 $\mu(T)$ 的平均次数为1.