频率和概率
频率和概率是不同的概念,我们经常把频率说成了概率。
如:
当我们抛一枚硬币100次,出现40次正面朝上,60次反面朝上,这时有人说,正面朝上的概率是 2/5,这就是没能将频率和概率区分出来。
在上面这个例子中,关于40次出现正面朝上,只能说正面朝上的频率是 2/5,而不能说概率是 2/5。
概率是理想值,频率是实验值。
概率指的是,在所有发生的事件中,某一个事件发生的次数占所有事件次数的百分比。这里的“所有发生的事件”,在现实中几乎是无法统计的,如:统计从古至今所有人抛硬币的数量、统计全国的民众对某个政策的满意度等,因此,通常的做法是通过大量的实验或抽样样本来估算出总体的概率值。
例如:抛硬币100次,出现正面的频率是 3/10,如果是1000次,出现正面的频率是 4/10,如果是10000次,出现正面的频率是5/10,也就是抛硬币的次数越多,频率值越接近1/2,这时的频率值就可以作为概率值。
对于概率的定义:
对某一随机现象进行了n次试验,其中A事件出现了m次,即其出现的频率为 m/n。经过大量反复试验,频率m/n越来越接近于某个确定的常数,该常数即为事件A出现的概率,常用P (A) 表示。
因此,根据大数定理可以认为在无穷多次试验中的频率值无限收敛于概率值。
平均值和期望值
我们经常也会把均值和期望搞混,实际上这两个也是不同的概念。
均值
均值就是对试验结果进行求和后除以结果数量。比如有n个实验结果 X
:x1,x2,x3.....xn,那么均值计算是:
均值是观察样本的平均值,通常抽样样本是不同的,所以不同样本的均值是不同的,但是对于同一个随机变量 X 来说,期望是唯一的,这就是它们的本质区别。
期望值
离散型随机变量X的取值为:
X对应取值的概率:
X对应取值的频率:
则期望值计算是:
例子,掷一枚六面骰子的期望值是 3.5,计算如下:
1 * 1/6 + 2 * 1/6 + 3 * 1/6 + 4 * 1/6 + 5 * 1/6 + 6 * 1/6 = 3.5
均值和期望的联系也是大数定理联系起来的。
随着重复次数接近无穷大,事件的平均值无限收敛于期望值。
总结
概率是频率随样本趋于无穷的极限。
期望值就是平均值随样本趋于无穷的极限。