1、用到的时候总结一下,回过来可以复习复习。
2、概率统计:统计是根据数据(一组数据),根据分布模型(比如正态分布),可以推测得到一个带参数的分布模型(比如mu和theda),然后根据这个分布模型,去求解发生某个事件的概率,需要查询分布函数图。这就需要知道相关的概念。
3、概率密度函数(probability density function)和概率分布函数(Cumulative Distribution Function,累积密度函数)。通过讲解正态分布去理解。
可以参考一下资料:https://www.jianshu.com/p/0cfc3204af77;
理解:概率密度函数PDF,主要是针对连续性的变量,但是连续性变量的概率为0,可以通过区间和极限的理解,那个变量点(比如x=3.2)对应的概率其实是一个区间,长方形的面积,所以发生在“期望值”的那个点的面积是最大的,因为长方形的“长度”是最高的(长方形的宽度都是一样的),所以,通过正态分布的图形,可以得知,两边变量点的面积最小,也就是说他们发生的概率都是小的,中间的是最大的。CDF是看斜率的,这个不好解释。
4、问题来了,为什么求解的时候,都是朝着“变量<某个值”的概率求解,而不是等于。等于也是区间,一般不会说等于,比如3.2,可以说成[3.19,3.21]这个区间的概率,可以这样简单理解一下,虽然不是很正确。那为什么都是小于呢?正态分布对应表就是对应的小于进行查询的,也就是说他是将所有小于这个变量值的变量的面积进行相加起来的面积。这个需要仔细看例子,可以参考资料:
https://zhuanlan.zhihu.com/p/128809461;一文搞懂“正态分布”所有需要的知识点
理解:通过上面资料的例子,可以看出,如果是正态分布的函数,那么我们查表的时候,都要变成“标准的正态分布”,就可以按照统一的标准正态分布表格去得到对应的概率。注:是小于多少的概率,如果问题变了,记住公式变换。