Copula,最小二乘法及lasso回归, 岭回归
之前讨论班准备的笔记,截取部分保存起来。
很低沉的一天。
C o p u l a Copula Copula函数
当边缘分布(marginal probability distribution)不同的随机变量(random variable),互相之间并不独立的时候,此时对于联合分布的建模会变得十分困难。此时,在已知多个已知边缘分布的随机变量下,Copula函数则是一个非常好的工具来对其相关性进行建模。
Copula理论首先在1959年由Sklar提出,指一个 n n n维联合分布函数可以由 n n n个边缘分布函数和一个Copula函数组成。Nelsen(1999)给出了Copula函数的严格定义。
S k l a r Sklar Sklar定理(1959)
Sklar定理主要指令 F ( ⋅ , ⋯ , ⋅ ) F(\cdot,\cdots,\cdot) F(⋅,⋯,⋅)为具有边缘分布 F 1 ( ⋅ ) , F 2 ( ⋅ ) , ⋯ , F n ( ⋅ ) F_{1}(\cdot), F_{2}(\cdot), \cdots, F_{n}(\cdot) F1(⋅),F2(⋅),⋯,Fn(⋅)的联合分布函数,那么存在一个将边缘分布和联合分布“连接”起来Copula函数 C ( ⋅ , ⋯ , ⋅ ) C(\cdot,\cdots,\cdot) C(⋅,⋯,⋅)满足:
F ( x 1 , x 2 , ⋯ , x n ) = C ( F 1 ( x 1 ) , F 2 ( x 2 ) , ⋯ , F N ( x n ) ) F\left(x_{1}, x_{2}, \cdots, x_{n}\right)=C\left(F_{1}\left(x_{1}\right), F_{2}\left(x_{2}\right), \cdots, F_{N}\left(x_{n}\right)\right) F(x1,x2,⋯,xn)=C(F1(x1),F2(x2),⋯,FN(xn))
若 F 1 ( ⋅ ) , F 2 ( ⋅ ) , ⋯ , F n ( ⋅ ) F_{1}(\cdot), F_{2}(\cdot), \cdots, F_{n}(\cdot) F1(⋅),F2(⋅),⋯,Fn(⋅)连续,则 C ( ⋅ , ⋯ , ⋅ ) C(\cdot,\cdots,\cdot) C(⋅,⋯,⋅)唯一确定; 反之,若 F 1 ( ⋅ ) , F 2 ( ⋅ ) , ⋯ , F n ( ⋅ ) F_{1}(\cdot), F_{2}(\cdot), \cdots, F_{n}(\cdot) F1(⋅),F2(⋅),⋯,Fn(⋅)为一元分布, C ( ⋅ , ⋯ , ⋅ ) C(\cdot,\cdots,\cdot) C(⋅,⋯,⋅)为相应的Copula函数,那么由上式定义的函数 F ( ⋅ , ⋯ , ⋅ ) F(\cdot,\cdots,\cdot) F(⋅,⋯,⋅)是具有边缘分布 F 1 ( ⋅ ) , F 2 ( ⋅ ) , ⋯ , F n ( ⋅ ) F_{1}(\cdot), F_{2}(\cdot), \cdots, F_{n}(\cdot) F1(⋅),F2(⋅),⋯,Fn(⋅)的联合分布函数。
多元正态 C o p u l a Copula Copula 函数
n n n元正态 C o p u l a Copula Copula 分布函数的表达式为:
C ( u 1 , u 2 , … , u n ; ρ ) = ϕ ρ ( ϕ − 1 ( u 1 ) , ϕ − 1 ( u 2 ) , … , ϕ − 1 ( u n ) ) C(u_1,u_2,\dots,u_n;\rho)= \phi_{\rho}(\phi^{-1}(u_1), \phi^{-1}(u_2),\dots,\phi^{-1}(u_n)) C(u1,u2,…,un;ρ)=ϕρ(ϕ−1(u1),ϕ−1(u2),…,ϕ−1(un))
其中 ρ \rho ρ为对角线上的元素为1的对称正定矩阵, ϕ ρ ( ⋅ , ⋯ , ⋅ ) \phi_{\rho}(\cdot,\cdots,\cdot) ϕρ(⋅,⋯,⋅)是相关系数矩阵为 ρ \rho ρ的标准多元正态分布函数, ϕ − 1 ( ⋅ ) \phi^{-1}(\cdot) ϕ−1(⋅) 是 ϕ ( ⋅ ) \phi(\cdot) ϕ(⋅)的逆函数。
多元 t − C o p u l a t-Copula t−Copula 函数
C ( u 1 , u 2 , … , u n ; ρ ) = T ρ , v ( T v − 1 ( u 1 ) , T v − 1 ( u 2 ) , … , T v − 1 ( u n ) ) C(u_1,u_2,\dots,u_n;\rho)= T_{\rho,v}(T^{-1}_v(u_1), T^{-1}_v(u_2),\dots,T^{-1}_v(u_n)) C(u1,u2,…,un;ρ)=Tρ,v(Tv−1(u1),Tv−1(u2),…,Tv−1(un))
其中 ρ \rho ρ为对角线上的元素为1的对称正定矩阵, T ρ , v ( ⋅ , ⋯ , ⋅ ) T_{\rho,v}(\cdot,\cdots,\cdot) Tρ,v(⋅,⋯,⋅)表示相关系数矩阵为 ρ \rho ρ、自由度为 v v v的标准多元 t t t分布函数, T v − 1 ( ⋅ ) T_v^{-1}(\cdot) Tv−1(⋅)是 T v ( ⋅ ) T_v(\cdot) Tv(⋅)的逆函数。
阿基米德 C o p u l a Copula Copula 函数
阿基米德Copula( Archimedean Copula)分布函数表达式为:
C ( u 1 , u 2 , ⋯ , u n ) = ϕ − 1 ( ϕ ( u 1 ) + ϕ ( u 2 ) + ⋯ + ϕ ( u n ) ) C\left(u_{1}, u_{2}, \cdots, u_{n}\right)=\phi^{-1}\left(\phi\left(u_{1}\right)+\phi\left(u_{2}\right)+