带你重拾概率论

最新推荐文章于 2024-03-01 20:29:12 发布

空字符（公众号：月来客栈）

最新推荐文章于 2024-03-01 20:29:12 发布

阅读量1.1k

点赞数 2

分类专栏：数学相关文章标签：机器学习概率论与数理统计

本文链接：https://blog.csdn.net/The_lastest/article/details/78759837

版权

本文介绍了机器学习中的参数估计，重点讲解了最大似然估计的概念和数学定义，包括如何求解最大似然估计的步骤，并通过实例说明其应用，如在二项分布的硬币抛掷问题中估计概率。同时，提到了在连续型随机变量中的似然函数形式。

摘要由CSDN通过智能技术生成

声明：

一、参数估计

所谓参数估计(Parameter estimation)指的是：用已知的样本数据在选定的分布（函数）下，进行参数估计的过程。

换在机器学习指的就是，在已知数据集（结果）和模型（分布函数）的情况下，估计出最适合该模型的参数。

1.1 最大似然估计

最大似然估计(Maximum likelihood estimation)就是指，在已知样本结果的情况下，推断出最有可能使得该结果出现的参数的过程。也就是说最大似然估计一个过程，它用来估计出某个模型的参数，而这些参数能使得已知样本的结果最可能发生。

举例：

假设你有一枚硬币，随机抛10次；现在的结果是6次正面。我们都知道，抛一枚硬币，正面朝上和反面朝上的概率均是 $\theta=0.5$ ；但前提时，这是在大量的实验（抛硬币）情况下才有的结论。那在我们这个情况下，参数 $\theta$ 到底取何值时才能使得出现6次正面的肯能性最大呢？

我们知道，抛硬币是符合二项分布 $B(n,p)$ ，也就是说我们现在已知样本结果以及函数分布，估计出使得该结果最大可能出现的参数 $\hat{\theta}$ 。则有：

L = P (X = 6) = C 610 θ^6 (1 - θ^) 4

$\mathrm{L}=P(X=6)=\mathrm{C_{10}^6}\hat{\theta}^6(1-\hat{\theta})^4$

而我们接下来要做的就是求当 $\mathrm{L}$ 取最大值时， $\hat{\theta}$ 的值。我们很容易求得当 $\hat{\theta}=0.6$ 时 $\mathrm{L}$ 取得最大值0.25；而当 $\hat{\theta}=0.5$ 时， $\mathrm{L}=0.21$

再假设你有一枚硬币，随机抛10次；现在的结果是7次正面。则此时使得该结果最大可能性出现参数 $\hat{\theta}$ 又是多少呢？按照上面的方法我们很容易求得当 $\hat{\theta}=0.7$ 时可能性最大。

关注

专栏目录