一道概率题引发对考研数学复习的思考
知识回顾
如题,今天上午我兴致勃勃地拿出2006年数学一做了起来。做前面还算顺利,直到最后那道概率题,关于极大似然估计的题目,我的内心:艹了,这怎么跟之前做的不一样,我靠。寄 ······
在平时上课和复习的过程中,老师都说过这部分就是送分题,只需要按照模板
- 根据概率密度或者分布律写出似然函数
- 写出对数似然函数
- 对参数求导,令导数等于0
- 解出参数的值,即为所求
我们平常这类题都是按照以上步骤。唯一可能出现麻烦的地方就是在第一步:根据概率密度或分布律写出似然函数。可能很多人在复习的时候都知道:假设有n个样本
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn,那么就将n个样本的概率相乘或者概率密度乘以n次方即可。但这道题目的概率密度竟然是分段的,和之前概率密度是一个表达式不同了。
我这时候就不知道该怎么做,竟然也将似然函数给分段写:(真的很蠢很蠢QWQ)
但这样做完全做不下去,我也知道自己做错了,但不知道在哪里做错了。明明这是一道不需要费心去复习的类型题,我竟然毫无办法。最后看了答案,我也在反思自己。明明是一道老师都瞧不起的题目,认为丝毫没有难度的题目,为什么出现在考研题目中我却不会做?!?!何况我这概率论还复习了一遍,这足以看出复习的效果是漏洞百出,建议重开好吧。
我认为是我自己对于如何产生的似然函数没有搞清楚,我就去翻了课本。课本的内容如下:
这段话的意思就是说,如果X是离散型随机变量,那么P{X=x}的概率与
x
x
x和
θ
\theta
θ有关,记作
p
(
x
;
θ
)
p(x;\theta)
p(x;θ)(p是关于
x
x
x和
θ
\theta
θ的函数)。那么样本之间是相互独立的,则同时取得
X
1
,
X
2
,
X
3
,
.
.
.
,
X
n
X_1,X_2,X_3,...,X_n
X1,X2,X3,...,Xn的概率就是p函数之积
∏
i
=
1
n
p
(
x
i
;
θ
)
\prod_{i=1}^{n}p(x_i;\theta)
i=1∏np(xi;θ)
而这里就说明了为什么似然函数是n个乘积的形式:我们首先是有n个样本,这n个样本是确定的,而n个样本对应n个观测值,且其每个样本的出现的概率为
p
(
x
;
θ
)
p(x;\theta)
p(x;θ)。那么这n个样本发生的概率就是这n个
p
(
x
;
θ
)
p(x;\theta)
p(x;θ)的乘积。类比一下,如果X是连续型随机变量,我们可以将每个样本的概率密度
f
(
x
i
;
θ
)
f(x_i;\theta)
f(xi;θ)相乘(这n个
f
(
x
i
;
θ
)
f(x_i;\theta)
f(xi;θ)可能不是相同的,因为不同的样本可能对应不同的
f
f
f,就比如说考研题里的分段函数)
我们再来看这段话:
有耐心的话可以仔细地体会以下这段话,我读完以后有一种豁然开朗的感觉。我们在上课的时候,老师都会举一个例子:在一个箱子里有100个黑球和白球,其中有一种球数目较多(或者说有99个),另一种球数目较少(或者说有1个),那么我们任意从箱子里取一个球,发现是黑球,那么我们就认为黑球是数目较多的那一类(或者说黑球有99个),而白球数目较少(或者说白球有1个)。
这个例子告诉我们:利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的参数值。概率论真难学啊艹
上面那段文字里提到:“我们已经取到
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn了,这表明取到这一样本的概率比较大,而取得该样本的概率就是我们之前构造的
L
(
θ
)
L(\theta)
L(θ)”。那么如果存在一个
θ
0
\theta_0
θ0,使得
L
(
θ
0
)
L(\theta_0)
L(θ0)成为最大值,那么这个
θ
0
\theta_0
θ0就是根据当前样本所推得的极大参数估计。所以我们要求
L
(
θ
)
L(\theta)
L(θ)最大值,就需要求导求极值点,我们上课学到的步骤也就有理可循了。
所以原来的那道考研题目,我就明白了该如何做了以及为什么是这样。
反思
我在复习的过程中,过于注重掌握计算的方法和流程了,对于原理没有很好的掌握。以至于题目换了一种考查方式,常见的方法失效了,而我又不明白课本是如何推导出这个方法,我也就无法从知识本身得出相对应的解法。而且我在复习的过程中,只注重过程的大方向,却把小细节忽略。上图最后应该加上
θ
的
最
大
似
然
估
计
为
θ
^
=
N
n
\theta 的最大似然估计为 \hat{\theta} = \frac{N}{n}
θ的最大似然估计为θ^=nN
- 掌握重点知识的推导过程和原理
- 重视书写形式,类似的还有特征向量、极值点和拐点的书写形式
什么是似然?它和概率有啥关系?
概率是指给定参数 θ \theta θ,求随机变量 X = x i X=x_i X=xi的可能性
似然是指给定样本 X = x i X=x_i X=xi,求 θ = θ 0 \theta=\theta_0 θ=θ0的可能性
极大似然就是给定样本 X = x i X=x_i X=xi,求使得 L ( θ ) L(\theta) L(θ)最大的 θ \theta θ值
每天总结反思亿点点,就能进步一点点~