概率统计问题

最新推荐文章于 2024-07-24 21:37:35 发布

jerry_young14

最新推荐文章于 2024-07-24 21:37:35 发布

阅读量231

点赞数

文章标签：概率论机器学习人工智能

本文链接：https://blog.csdn.net/jerry__young/article/details/125625472

版权

一个活动，n个女生手里拿着长短不一的玫瑰花，无序的排成一排，一个男生从头走到尾，试图拿更长的玫瑰花，一旦拿了一朵就不能再拿其他的，错过了就不能回头，问最好的策略？

选择的策略为设定一个值r，规定只看而不选取前r个女生，然后从第r+1个女生开始选取，若任何一个女生比之前的女生玫瑰花都长，则选取这个女生。这样，该问题的未知数就为r，假设在第k个女生上选取到了最长的玫瑰花，则其综合概率为：
$P(r)=\sum_{k=r+1}^{n} P(第k个女生被选中且拥有最长的玫瑰花)\\ =\sum_{k=r+1}^{n} P(第k个女生的玫瑰花最长)P(第k个女生被选中|第k个女生的玫瑰花最长)\\ =\sum_{k=r+1}^{n} \frac{1}{n} P(前k-1个女生中最长的玫瑰花在前r个女生中)\\ =\sum_{k=r+1}^{n} \frac{1}{n} \frac{r}{k-1}=\frac{r}{n} \sum_{k=r}^{n-1}\frac{1}{k}=\frac{r}{n}*\frac{1}{n} \sum_{k=r}^{n-1}\frac{1}{\frac{k}{n}}=x\int_{x}^{1} \frac{1}{t} dt=-x\ln x\\ P'(r) = -(\ln x + 1)\\ 令P'(r)=0,则有x=\frac{1}{e},所以当\frac{r}{n}=\frac{1}{e},即r=\frac{n}{e}时,P(r)_{max}=\frac{1}{e}$

某大公司有这么一个规定：只要有一个员工过生日，当天所有员工全部放假一天。但在其余时候，所有员工都没有假期，必须正常上班。这个公司需要雇佣多少员工，才能让公司一年内所有员工的总工作时间期望值最大？

假设一年365天，对于一年中的一天，员工上班的概率为 $(1-\frac{1}{365})^{n}$ 。对于一年来说，整体员工的期望上班时间为： $所有员工书 * 每天所有员工上班概率 * 365$ ，即：
$E(n)=n*(1-\frac{1}{365})^{n}*365$
对其求对数得：
$\ln E(n)=\ln 365 + \ln n + n*\ln (1-\frac{1}{365})$
对 $n$ 求导，并令导数为0，得：
$\frac{d\ln E(n)}{dn}=\frac{1}{n}+\ln (1-\frac{1}{365})=0\\ \frac{1}{n}=-\ln (1-\frac{1}{365})=\ln \frac{365}{364} \rightarrow n\approx 365$

切比雪夫不等式

$P(|X-\mu|\geq k\sigma)\leq \frac{1}{k^{2}},\quad 其中k > 0,\mu为期望,\sigma为标准差$

一根绳子，随机截成3段，可以组成一个三角形的概率有多大？

设绳子长为 $a$ ，折成三段的长度为 $x, y, a - x - y$ ，根据约束条件 $x > 0, y > 0, a - x - y > 0$ 可得其可行域（三角形区域）所围成的面积为 $\frac{1}{2}a^2$ 。构成三角形的条件为 $x + y > a - x - y, a - y > y, a - x > x$ ，其可行域（三角形区域）所围成的面积为 $\frac{1}{8}a^2$ ，所以构成三角形的概率为：
$\frac{\frac{1}{8}a^2}{\frac{1}{2}a^2}=0.25$

最大似然估计和最大后验概率的区别？

最大似然估计（MLE）提供了一种给定观察数据来评估模型参数的方法，即“模型已定，参数未知”。给定一个已知的模型结构和采样得到的观察数据（这里假设数据是独立同分布的），最大似然估计的目的就是通过这两项来估计模型的参数，用公式可以表示为：
$\tilde{\theta}_{MLE}(x)=\mathop{\arg\max}_{\theta}f(x|\theta)$
最大后验概率（MAP）是根据经验数据获得对难以观察数据的估计。与最大似然估计不同的是，最大后验估融入了估计量的先验分布在其中，即模型参数本身的概率分布。估计过程中，需利用先验概率和贝叶斯定理得到后验概率，目标函数为后验概率的似然函数，求得该似然函数最大时的参数值，即MAP的目标结果，假设 $\theta$ 的先验分布为 $g(\theta)$ ，那么用公式可以表示为：
$\tilde{\theta}_{MAP}(x)=\mathop{\arg\max}_{\theta}\frac{f(x|\theta)g(\theta)}{\int f(x|\theta ')g(\theta ')d\theta '}=\mathop{\arg\max}_{\theta}f(x|\theta)g(\theta)$