前言:
定理:
大数定理,依概率收敛
目录:
- 参数估计概念
- 点估计
- 矩估计理论基础
- 矩估计步骤
- 例子
一 参数估计概念
参数: 反映总体某方面的特征向量,例合格率,方差,均值,中位数
参数估计两种方法: 点估计和区间估计。
区别:
点估计只提供单一的估计值,而区间估计在点估计的基础上还提供了一个误差界限,给出了取值范围——
这个取值范围又叫置信区间(confidence interval),受置信度(一个概率值,即进行估计前必须事先确定的估计的把握度)影响,
根据中心极限定理推导得来。
二 点估计
设总体X未知参数为,为X的简单随机样本,构造合适的统计量
用来估计未知参数, 称为参数的点估计量
给定观察值, 称为的点观察量
三 矩估计法理论基础
理论依据: 辛钦大数定律 依概率收敛
(辛钦大数定律)
(原点矩)
(中心矩)
四 矩估计步骤
设有k个未知参数, 是来自总体X的样本,假设总体的前K阶矩存在
2.1 写出总体矩,关于参数的函数
则有k个方程
2.2 写出参数,关于总体矩的反函数
2.3 使用样本矩,替代总体矩(原点矩,或者中心矩)
五 例子
5.1 设,p未知, 是x的样本,求P得矩估计量
解:
step1: 总体矩
step2: 反函数:
step3: 样本矩
4.2 一个罐子里面放满了糖,求糖的数目
解:
从罐子里面取出k个糖,做完标记,放回。
再随机抽样m个,找到其中标记过的糖k_1
step1 标记的糖总体矩为
step2 反函数
step3: 样本矩替代总体矩:
则
计算机模拟结果:
左图 n = 10000 (实际总体样本数目) ; m = 2000(抽样数目); X(K 做标记的数目,事件概率);Y(矩估计值)
右图 n=10000(实际总体样本数目);m=4000(抽样数目)
通过图上看到,矩估计的误差比较大,同时做标记的数量越小,误差越大.
:
# -*- coding: utf-8 -*-
"""
Created on Thu Apr 1 16:02:02 2021
@author: chengxf2
"""
import numpy as np
import random
import copy
import matplotlib.pyplot as plt
'''
放回取样,从总体中随机选取m 个样本
'''
def mChoice(apple, m):
random.shuffle (apple )
mList = apple[0:m]
# print("\n mList: ",mList)
return mList
'''
从总体n中随机选取k个样本,做个标记
'''
def TotalChoice(apple, k):
random.shuffle (apple )
kList = apple[0:k]
#print("\n kList: ",kList)
return kList
'''
评估重合的部分
'''
def estimation(a, b):
tmp = [val for val in a if val in b]
k1 = len(tmp)
return k1
def Calc(k1,k,m):
if k1==0:
return 0
n = int((k*m)/k1)
#print("\n 评估的n ",n,k,k1,m)
return n
def MarixEst():
n = 10000
m = 4000
print("\n ================Test===================")
apple = np.arange(0,n)
X = np.arange(100,3000,100)
Y =[]
for k in X:
# 先分配一个变量
# print("\n k:: ",k)
appleTotal = copy.deepcopy(apple)
#总体中采样k个
kList = TotalChoice(apple,k)
#放回采样
mList = mChoice(appleTotal,m)
#检查重合部分
k1= estimation(kList, mList)
n= Calc(k1,k,m)
Y.append(n)
plt.scatter(X,Y,c='r')
plt.plot([50,2000],[10000,10000])
plt.legend()
MarixEst()
5.3 设总体x的密度函数为,求的矩估计
解: step1: 总体矩
step2: 求解反函数
step3: 样本矩替代总体矩