应用的场景:
现有10000新员工入职,公司的hr想知道新员工的参训人数的比例,而由于某些原因,不能公开所有新员工的信息,现给出了2500个用户的数据,让你计算下新员工的参训人数的比例。
这里我们使用概率密度函数,来解决这个问题,hr给了个限定标准,作为她可以接受的一个计算结果的预期值:
如果计算的结果的概率,在总体点估计量:概率P的[-0.65, +0.65]区间内,就可以接受这个求得的结果
自己的一些见解:总体的实际参训人员的概率为0.6,我们因为没有完整数据不能求得这个值,但可以给出一个估计值,这个估计值在[0.6-0.065, 0.6+0.065]范围内,我们就接受这个估计的值,这里的概率密度解决了这个问题。
一 原理
首先来看一张图(图片源于网络)
红色的部分就是概率密度,它是一个面积,更多的原理请查阅统计学方面的知识。
二 Python的处理过程
import numpy as np
from pyecharts import Bar
from scipy.stats import norm
training_all = np.random.normal(265, 4,