Mtalab统计信息处理的一些原理

本文介绍了Matlab中进行统计信息处理的一元和多元线性回归分析,包括最小二乘估计和极大似然估计。同时,深入探讨了高阶统计量的理论,如特征函数、累积量和高阶累积量,并讨论了它们在处理非线性系统和抑制高斯噪声中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

回归分析


一元线性回归分析

基本定义

假设随机变量y和变量x之间服从以下线性关系
y=α+βx+ε

现存在n个值
yi=α+βxi+εi

假设 εi 相互独立而且满足
εi ~ N(0,σ2),i=1,...,n,
则称变量y和x服从一元线性回归模型(或一元线性正态回归模型)



未知参数估计


(1) (α,β)

偏微分最小估计

ni=1(yiαβxi)2=maxα,β(yiαβxi)2

对左边求偏导,得到

α=y¯βx¯
β=ni=1(xix¯)(yiy¯)ni=1(xix¯)2



(2) (α,β)

由于 yiyi ~ N(α+βxi,σ2)
则联合概率密度为
L=Ni=11σ2πexp[12σ2(yiαβxi)2]
=(1σ2π)nexp[12σ2ni=1(yiαβxi)2]

求上述方程最大值,等价于求下述最小值 ni=1(yiαβxi)2
所以又回归到最小二乘估计



(3) σ2 的估计

1)由 μ1=E(Y)=μ
μ2=E(Y2)=D(Y)+[E(Y)]2=σ2+μ2
得到: μ=α+βx¯
σ2=1nni=1Y2iY¯¯¯2=1nni=1(yiαβxi)2

=1nni=1(yiy¯)2β(1nni=1(xix¯)2)




多元线性回归分析


基本定义
y=β0+β1x1+....+βmxm+ε
最后有 yi ~ N(β0+β1x1i+....+βmxmi,σ2)



未知参数估计
常常用最小二乘法寻找 β=(β0,.....,βm)Tβ,使
ni=1(yinj=1xjiβj)2=minβni=1(yimj=0xjiβj)2
对各自( xki )求偏导,最后得到
ni=1yixki=ni=1mj=0xjixkiβj=ni=1(mj=0xjixki)βj
矩阵表示
XTY=(XTX)β
可得:
β=(XTX)1XTY






高阶统计量理论


高阶统计量(HOS)理论来自对数学、统计学和信号处理等领域的研究.高阶统计量理论是在二阶统计量(相关函数和功率谱)基础上发展起来,它克服了二阶统计量因缺少相位信息而无法直接处理非最小相位系统的固有缺陷,并包含了更丰富的内容。目前,高阶统计量方法已在雷达、声呐、通讯和故障诊断等领域获得了大量的应用。


高阶统计量定义


随机变(向)量的特征函数

特征函数法是概率论和数理统计的主要分析工具之一



定义1:
1)第一特征函数: ϕ(w)=f(x)eiwxdx
特征函数是密度f(x)的傅里叶变换,因为f(x)>=0,所以原点最大值:
l ϕ(w) l<= ϕ(0)=1


2)第二特征函数: ψ(w)=ln[ϕ(w)]



定义2:
推广到n元,X= [x1,x2,...,xn]T ,具有联合概率密度f(X)
即换为 ϕ(w1,...,wn)ψ(w1,...,wn)



定义3:(K阶矩)
随机变量x的第一特征函数 ϕ(w)kxkmk ,即
mk=ϕ(k)(w)|w=0=E[xk]=xkf(x)dx



定义4:(k阶累计量)
随机变量x的第二特征函数 ψ(x)kxkck ,即
ck=ψ(k)(w)|w=0




高阶累积量的定义和性质



定义:
在数学中,平稳随机过程(Stationary random process)或者严平稳随机过程(Strictly-sense stationary random process),又称狭义平稳过程,是在固定时间和位置的概率分布与所有时间和位置的概率分布相同的随机过程:即随机过程的统计特性不随时间的推移而变化。这样,数学期望和方差这些参数也不随时间和位置变化

设{x(n)}是均值为零的k阶平稳随机过程,
则该过程的k阶矩定义为:
mkx(τ1,...,τk1)=mom{x(n),x(n+τ1),x(n+τk1)}
K阶累积量:
ckx(τ1,...,τk1)=cum{x(n),x(n+τ1),x(n+τk1)}
性质:
1) λi ,则

cum{λix1,...,λkxk}=ki=1λicum{x1,...,xk}

2)累积量关于变量对称,即cum内部顺序可任意打乱

3)可加性,即
cum{x0+y0,x1,....}=cum{x0,x1,....}+cum{y0,x1,....}

4)如果a为常数,则
cum{x0+a,x1,....}=cum{x0,x1,....}

5)如果随机变量 xi,yi ,则
cum{x1+y1,....,xk+yk}=cum{x1,....,xk}+cum{y1,....,yk}

6)如果随机变量中某个子集与其补集相互独立,则
cum{x1,....,xk}=0




高斯过程的高阶累积量



随机变量x服从高斯分布 N(0,σ2) ,则其概率密度函数为
f(x)=12πσex2/2σ2
则第一特征函数为:
ϕ(w)=eσ2w22
第二特征函数为:
ψ(w)=ln(ϕ(w))=σ2w22




高斯随机过程



假设n维高斯随机向量 x=[x1,...,xn]T ,
均值向量为 μ=[μ1,...,μn]T ,
协方差矩阵为 Σn×n ,
其中 Σi,j=E{(xi/mui)(xj/muj)}
这里写图片描述
这里写图片描述
图中 aμ


由于 ψ(w) 是关于变量 wi 的二次多项式,因此 ψ(w) 关于变量 wi 的三阶以上导数等于0,则x的三阶以上累积量等于零。进一步,对于高斯随机过程x(n),其阶次大于2的k阶累积量也为零,即
ckx(m1,...,mk1)=0,k>=3
因此高阶累积量可以自动抑制高斯背景噪声的影响





高阶累积量与非线性系统
这里写图片描述
之间的相互耦合信息,使不同频率成分间由于相位的相关性而相互耦合,是能量分布由于非线性耦合而发生变化的反映,因此从二阶响应中可以提取二阶非线性相位耦合信息





双谱定义



定义:
实际中由于任何高斯过程的高阶累积量均等于零,而高阶矩却无此优点,所以常常使用累积量及其谱,它在理论上可完全抑制高斯有色噪声的影响,习惯上将高阶累积谱简称作高阶谱,最常用的高阶谱是三阶谱(双谱)和四阶谱(三谱)



这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值