做了个纸模型时间就飞掉了
现在要concentrate 了
首先补充一下上次的笔记
计算概率,以正态分布为例的时候,
估算
估算分点估算和区间估算
点估算是通过,用此前已有的信息和抽样样本(抽样信息),产生最接近参数值的估计值来估计参数值
区间估算,用此前已有的信息(先验信息),和抽样信息来产生在某个给定概率水平上包含真实参数值的区间
所以有置信区间
P(θ ^ 1 <θ<θ ^ 2 )=1−α
α
为显著水平
1−α
为置信系数
抽样产生 θ ^ 的分布,则其基本特征由其期望和方差(样本方差)来表述
期望
E(θ ^ )
方差
Var(θ ^ )=E((θ ^ −E(θ ^ )) 2 )=E(θ ^ 2 )−(E(θ ^ )) 2
标准误standard error ;Se :
Se(θ ^ )=Var(θ ^ ) − − − − − − √
然后估计是有偏差的bias
衡量数据是不是无偏的就要算偏差是不是零
偏差
PS:注意抽样误差( θ ^ −θ )和偏差的区别 期望!
之后是均方误差(MSE mean square error)
均方误差和方差的关系是
展开即可证明
PS: 均方误差是和原本参数的差的平方的期望;而样本方差是和估计量的期望的差的平方,两者注意区别
所以当我们评价一个估计量时有
1.无偏性
E(θ ^ )=θ
样本较小时,我们计算平均值求
μ
其中
X ¯
是估计量 我们说
E(X ¯ )=μ
所以
X ¯
是
μ
的无偏估计量
注意是期望
2.有效性
1)
θ ^
具有无偏性
2)
Var(θ ^ )<Var(θ ~ )
,
θ ~
指任何其他无偏估算量
满足上述两个条件我们称之为 有效性,即存在无偏还有最小的方差
如果满足上述两个条件的同时,又满足 估计值 θ ^ 是样本观测值的线性函数,则我们将其称为最佳线性无偏估计
估算量渐进 (大样本)
大样本时,即样本数量接近无穷大时
1 渐进无偏性,样本数量接近无穷大 估计量无偏
2一致性
概率收敛于
θ
即若bias = 0, lim x→∞ MSE(θ ^ )=0 则称之为 θ 的一致性估计量
:等于 样本很大时,每一个估计量都几乎和参数相等
3渐进有效性
样本数很大时 估计量有样本方差和均值确定的分布
具有一致性:样本很大时估计值在参数邻域内的概率为1,或者偏差为零,均方误差为0
然后方差比其他估算量的方差更小
估算方法
矩估,最小二乘法和最大似然法(就是最像的!Most likely)
1 矩估:矩估就是构造样本值一阶矩或二阶矩的期望来表示参数 θ 的函数,之后用样本平均值或者 样本 2 的平均值代入解出 θ
2最小二乘法 所谓最小二乘法就是让参数估计量估计的样本值和实际观测值的离差平方和最小,就是观察到
x i
时,利用
θ ^
表示出x然后求出使离差平方和最小的
θ ^
一般都求导
参考
3.最大似然法 所谓最大似然法就是假设本样本出现的概率是最大的,求得对
θ
的估计值
具体方法是1.离散概率分布:假设
X i
出现的概率为
f(x i ;θ)
那么本样本出现的概率即最大似然函数为
然后令
解得 θ 即 θ ^
一般来讲 在求导时 为了便于计算都将其对数化
由于 ln(L(θ)) 与 L(θ) 单调性相同所以对 ln(L(θ)) 求导一般能使运算更为方便且结果相同
即一般都这么算
化乘法为加法
2.连续分布型的话 则是概率密度函数相乘,之后步骤相同
可以求得最大似然估计量是具有渐进有效性的。(满足一致性,无偏性基础上,均方误差 MSE=0)