随机抽样
numpy.random模块对Python内置的random进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数,如正态分布,泊松分布等。
~Numpy.random.seed(seed = None) Seed the generator.
seed()用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed()值,则每次生成的随机数相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异儿不同。
在对数据进行预处理时,经常加入新的操作或者改变处理策略此时如果伴随着随机操作,最好还是指定唯一的随机种子,避免由于随机的差异对结果产生影响。
离散型随机变量
二项分布
一次实验只有两种结果。
代码:binom.pmf(k) = choose(n,k)p**k(1-p)**(n-k)
帮助记忆:一共n次,概率为p的出现k次,概率为(1-p)的出现(n-k)次。
泊松分布
想起宇哥说的话:一定时间段内,源源不断的质点来流的概率?记得对吗???
——用于估计某个时间段某事件发生的概率。