数学:概率论与数理统计

最新推荐文章于 2020-12-23 11:24:23 发布

无聊的人生事无聊

最新推荐文章于 2020-12-23 11:24:23 发布

阅读量808

点赞数 1

分类专栏：数学物理数学直观文章标签：概率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Wangpeiyi9979/article/details/93378985

版权

数学物理同时被 2 个专栏收录

15 篇文章 5 订阅

订阅专栏

5 篇文章 1 订阅

订阅专栏

前言
这篇博客是对《马同学——概率论与数理统计》以问答形式的总结。

文章目录

一、概率论的基本概念
二、随机变量
三、多维随机变量及其分布
四、随机变量的数字特征
五、大数定律与中心极限定理
六、数理统计的基本概念
七、参数估计
八、假设检验

一、概率论的基本概念

概率论起源于什么现象，该现象有什么特点?,小节1

概率论起源于随机现象。它(1)充满不确定性。(2)但结果又有迹可循。

试描述赌徒事件，其中的争议，以及涉及到的人物，最后如何解决, 小节2-小节3

问题双方: 梅累骑士与尼古拉斯(化名)
问题解决: 帕斯卡与费马

试举例说明什么是真随机，什么是伪随机。

真随机: 薛定谔的猫，状态本身不可预测
伪随机: 掷骰子，若给定所有限时条件，可以解出是那一面。

概率的几大学派，他们各自的观点，他们各自观点的优点和缺点?

频率派: 认为随机现象多次试验结果具有稳定性，当试验次数足够大，就得到概率。
古典派: 不充分理由原则(伯努利), 未知的概率都为等概率(拉普拉斯).
主观派: 认为概率是"信念强度"

古典派确定概率的原则是什么，涉及到哪些人物?, 小结4、5

不充分理由原则(伯努利), 未知的概率都为等概率(拉普拉斯).

什么是样本空间?什么是样本点？什么是事件？什么是事件的发生?,小节5,6,7

样本空间: 包含所有样本的集合。
样本点: 样本空间中的样本点。
事件: 样本空间的某个子集。
事件的发生: 事件中的某个样本点出现。

概率公理化的三个公理是什么?概率公理化的核心思想是什么?, 小节1,2

非负性公理、规范性公理、可加性公理。
核心思想是把概率P定义为一个函数。

为什么说概率函数的定义能够使得概率论在各大派别之间保持中立?, 小节3

因为定义的概率函数为抽象函数，可以使用不同派别的计算方式进行计算。

二、随机变量

对应随机变量的二项分布，分布可记做 $\sim b(n, p)$ 。(其中"n"为得到是的次数，"p"为得到是的概率)。特点是任意两次实验之间独立，概率密度函数为 $\binom{n}{k}p^k(1-p)^{1-k}$ 。

概率质量函数和累积分布函数(CDF)是什么，小节1，小节7。
如何通过期望来求解赌徒事件中奖金分配问题。, 小节2。
是准确描述数学期望的定义，以及其的限制条件，小节3。
如何从杠杆原理理解期望是"不确定性到确定性的桥梁"的意义, 小节4。
如何从重心理解期望的"加权平均"意义以及概率质量函数为什么叫概率质量函数。小节5.

值: 力矩，概率: 质量。期望: 所有力矩*质量的和，即重心所在位置(所有概率质量和为1)。这也是期望被称作一阶矩的原因。

期望满足齐次性和可加性，因此是线性函数，可以直接使用线性代数的结论。
二项分布的期望为 $n p$ .
试描述用期望指导二战征兵验血的过程。小节7.
什么是辛普森悖论，如何从向量观点理解。小节8.
如何从打靶理解该式: $\frac{(X_1 - \bar{X})^2 + (X_2 - \bar{X}) + ...+ (X_n-\bar{X})}{n}$ 。
$Var(X) = E(X^2)-u^2,Var(c) = 0, Var(aX+b)=a^2Var(X)$
从不充分理由原则理解二项分布方差最大时， $p=\frac{1}{2}$ ,小节6
马尔科夫不等式是由什么进行估计，回想巨人国的例子并推出马尔科夫不等式。
切比雪夫不等式是由什么进行估计的，回忆其推导过程以及其图像。, 小节8。
泊松分布是二项分布的极限，泊松分布的形式是什么，试推导泊松分布, 小节1-4
泊松分布的三个条件是什么?生活中常见的满足泊松分布的场景有哪些?. 小节5.
什么是帕斯卡分布，试描述著名的巴拿赫火柴问题, 小节3
负二项分布和几何分布的关系是什么?,小节4
超几何分布是什么，它和二项分布的差别是什么?, 小节6
描述所有常见的离散分布，以及他们的物理模型。, 小节7
正太分布起源于什么，如何理解中心极限定理。. 小节1,2,3
考试成绩符合正太分布吗？为什么?, 小结3.
上 $\alpha$ 分位点是什么?, 小节5.
六西格玛原则具体指什么，如何应用到生产当中。, 小节7.
泊松过程是如何从泊松分布推广定义的?, 小节3
如何使用泊松过程引出指数分布，并说明为什么灯泡寿命服从指数分布。, 小节4.
指数分布的期望物理意义是什么?, 小节5.
指数分布的无记忆性, 小节6.
几何分布和指数分布是唯二的无记忆性的分布。
试说明各大重要分布以及各分布之间的联系。,小节8.
累积分布函数的三个性质是什么?, 小结2
如何使用逆采样变换结合随机分布来采样符合指数分布的实例, 小节7.
如何理解随机变量函数的概率密度函数求解定理?, 小节6.

$\to p(y)=p(x)\frac{|dx|}{|dy|}=p(h(y))|h'(y)|$

编程实现各大分布。

三、多维随机变量及其分布

四、随机变量的数字特征

期望是线性函数，满足齐次性和可加性，本质上是因为积分是线性函数。
利用期望的线性性质解如下题.小节4

在一个口袋中装有m个颜色各不相同的球，每次从中任取一个，有放回的摸取n次，以X表示在n次摸球中摸到球的不同颜色的数目，求E(X)。

五、大数定律与中心极限定理

伯努利大数定律描述了什么？如何证明?,小节1。
依概率收敛和数列极限的区别是什么，为什么大数定律需要用依概率收敛表示?, 小节2。
辛钦大数定律指的是什么，需要满足什么条件?, 小节3。
切比雪夫大数定律指的是什么？需要满足什么条件?, 小节4
大数定律总结:
描述中心极限定理, 他需要满足的条件是什么?, 小节3
从高尔顿钉板、分布演化理解为什么大量分布叠加会收敛于正态分布，小节4
中心极限定理有更宽松的条件，只需要满足独立即可

六、数理统计的基本概念

如何理解"统计"是"概率"的逆向操作?, 小节1.
统计中的"总体"、“个体”、"样本"指的什么?,小节2,3

总体:所有测试结果。个体:每一次的测试结果。样本: 从总体中抽取出的n个个体。
如何理解样本通常记作 $X_1,X_2,...,X_n$ , 样本具有随机性和确定性?, 小结3
简单随机样本的两个特点?, 小节4

样本中的个体互相独立，样本与总体同分布。
统计量：完全由样本决定的量叫做统计量。小节1
如果样本满足独立且和总体同分布，那么根据辛钦大叔定理，可以通过 $\bar{X} = \frac{X_1+X_2+...+X_n}{n}$ 估计总体均值 $u$ 。
样本方差 $S^2 = \frac{1}{n-1} \sum_{i=1}^N(X_i-\bar{X})^2=\frac{1}{n-1}(\sum_{i=1}^NX_i^2-n\bar{X}^2)$ ，为什么?, 小节4。
为什么说需要多采样几次样本方差 $S^2$ 才能估计总体方差 $\sigma^2$ , 小节4。
安斯库姆四重奏是怎样的，说明了什么问题?,小节5。
如何理解统计量本身也是随机变量，所以也具有分布?, 小节1。
统计量 $\bar{X}$ 服从什么分布，有什么作用?, 小节1。
抽样分布是指统计量的分布，三大抽样分布是那三大分布?, 小节2。
三大分布的作用和意义(待理解）

(1) 衡量统计量对真实分布参数的逼近靠谱程度(当样本数量不多，大数定律无法保证靠谱)。比如 $\frac{(n-1)S^2}{\sigma^2} \sim \mathcal{X}^2(n-1)$ (小节6), 自由度为 $n - 1$ 的卡方分布的概率密度图像我们知道， $n$ 是常数，那么我们就能够估算统计量 $S^2$ 和 $\sigma^2$ 的比值。
(2) 生活中大部分分布是高斯分布，进行参数的区间估计时，需要建立统计量和真实参数的关系，会用到抽样分布。

七、参数估计

估计量的定义是什么，点估计的定义是什么?小节1。

估计量 $\hat{\theta}(X_1,X_2,...,X_n)$ 是统计量的特例，它是对未知参数 $\theta$ 的近似, 称 $\hat{\theta}是\theta$ 的点估计。

一致估计的定义是什么, 说 $\bar{X}$ 是 $u$ 的一致估计的理由是什么?, 小节2。
样本 $k$ 阶矩是什么?总体 $k$ 阶矩是什么，为什么说样本 $k$ 阶矩是总体 $k$ 阶矩的一致估计。, 小节3。
矩估计是什么，试使用矩估计法估计均匀分布参数 $U (a, b)$ ?, 小节4。
最大似然估计的思想是什么，它的完整定义是什么?, 小节6、7、8.
点估计包含矩估计和最大似然估计。
最大似然估计和矩估计计算结果不一定相同。
估计量的优劣性评价的3个指标，其中一致性、无偏性、有效性是什么?, 小节2,3,4
统计是工程学科，采用的估计量或者估计方法需要按实际问题确定。比如使用 $\bar{S^2}$ 和 $S^2$ 来估计 $\sigma^2$ , 两个估计量各有优势。
区间估计的引入原因是什么?, 小节1
如何理解 95% 置信区间？, 小节2.

抽样100次，构成100个区间，其中95个区间会包含要估计的参数。
置信区间的严格定义是什么?. 小节6.

估计目标: $\theta$ , 给定条件 $\alpha$ , 置信水平: $1-\alpha$ ；找到: 置信下限(统计量): $\underline{\theta}$ ; 置信上限(统计量): $\bar{\theta}$ ; 置信区间： $(\underline{\theta},\bar{\theta})$ . 使得 $\theta$ 在置信区间的概率大于等于 $1-\alpha$ .
置信区间的计算步骤是什么，如何理解?, 小节4.

(1) 根据实际情况找到合适的常见分布。（建立统计量和估计参数的联系)
(2) 根据常见分布计算 $f(\hat{\theta},\theta)$ 概率大于等于 $1-\alpha$ 的最小区间
(3) 最后移项求解出 $\theta$ 的区间。
如果有 $\sim N(u, \sigma^2)$ , 说明不同情况下要估计 $u$ 和 $\sigma^2$ 所使用的分布. 小节5

八、假设检验

假设检验理论发展与女士品茶故事，是哪位数学家提出得假设检验理论?试描述此故事, 小节1.
说明女士品茶单边假设检验的原假设 $H_0$ 和备择假设 $H_1$ ，以及进行单边假设检验的步骤, 小节2.

(1) 明确原假设、备择假设: $H_0$ : $\sim b(p,10), p\le 0.5$ (不具备正确分辨的能力)。 $H_1$ : $\sim b(p,10), p>0.5$ (具备正确分辨的能力)。
(2）假定原假设成立。给出原假设边界(即 $p = 0.5$ )的概率密度图像(因为边界拒绝域包含了非边界拒绝域)，根据概率密度函数确定拒绝域。
(3) 判断事实是否落入拒绝域，若落入，则拒绝 $H_0$ , 否则接受。
说明女士品茶的双边假设检验的原假设 $H_0$ 和备择假设 $H_1$ , 以及进行双边假设检验的步骤。小节3
假设的指定要符合什么原则?, 小节4

无罪推定、便于计算。
说明第一类错误和第二类错误是什么?我们应该首先控制哪一类错误?, 小节5
说明总体 $\sim N(u, \sigma^2)$ ，当 $\sigma^2$ 已知/未知时, $u$ 的双边检验和单边检验的方法, 小节1，小节2
说明总体 $\sim N(u, \sigma^2)$ ，当 $u$ 已知/未知时， $\sigma^2$ 的双边检验和单边检验的方法, 小节4
置信区间和假设检验的联系？(待理解)
假设检验的总结, 小节6.

无聊的人生事无聊

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
数学:概率论与数理统计

前言这篇博客是对《马同学——概率论与数理统计》以问答形式的总结。文章目录概率论的基本概念概率论的基本概念概率论起源于什么现象，该现象有什么特点?,小节1试描述赌徒事件，其中的争议，以及涉及到的人物, 小节2-小节3概率的极大学派，他们各自的观点，他们各自观点的优点和缺点？什么是样本空间?什么是基本事件？什么是事件？什么是事件的发生?,小节5,6,7概率公理化的三个公理是什么?概率...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。