【读书笔记->统计学】08-01 连续型概率分布与正态分布-连续数据、概率密度函数、连续概率概念简介

连续型概率分布与正态分布

连续数据

前面讲到的概率分布涉及的都是离散数据,即数据由一个个单独的数值组成,其中的每一个数值都有对应概率。例如,在分析老虎机收益概率分布时,每一局赌局出现的收益数额是确定的,我们很清楚各种情况的赔率,也知道自己有机会赢到其中一种。

如果是离散数据,则为数值型数据,只能取确切值。离散数据往往能以某种方式进行计数,例如糖果机中的糖果数目,智力游戏中答对的问题的数目,或是在一个特定时段内的故障次数。

在这里插入图片描述

但并非所有数值型数据都是离散的。有时候,数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件结果。例如,假定有人让你精确地测量几段丝线的长度,并且已知这些丝线的长度在10英寸到11英寸之间,你的测量结果可能会是10英寸、10.1英寸、10.01英寸,等等,因为丝线长度可以是这个范围内的任意值。

这样的数据叫做连续数据,连续数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度要求。

在这里插入图片描述

离散概率分布可以求出离散数值的概率,那么连续数值需要连续概率分布来求概率。

概率密度函数

假设一个情境:朱莉目前正值适婚年龄,因此有很多场相亲,但是有时候相亲男都不准时到场,或者根本就不现身。于是她给自己立了规矩:如果等过20分钟对方还不来,她就离场。

下面这张频数图显示出朱莉为了见到约会者而等待的时间:

在这里插入图片描述

上面的数据是连续数据。我们再也无法给出每一个数值的概率,因为我们不可能列举每一个精确数值。例如,朱莉的约会者可能会在4分钟以后出现,在4分钟10秒以后出现,或在4分钟10.5秒以后出现,我们不可能数清楚所有的可能时间。相反,我们需要关心的是一个特定精度水平,以及取得一个数值范围的概率。

对于离散概率分布来说,我们关心的是取得一个特定点值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围的概率。


概率密度函数可用于描述连续数据

我们可以用概率密度函数描述连续随机变量的概率分布。

概率密度函数f(x)是这样一种函数:通过它可以求出一个数据范围内的某个连续变量的概率,它向我们指出该概率分布的形状。

下面是一张概率密度函数图,示意了朱莉为了见到约会者而等待的时间,最初20分钟以内的概率是一个常数,随后下降为0,因为这时朱莉离开了。

在这里插入图片描述

上图和频数图非常相符,这并非巧合。

概率的实质是告诉我们事情发生的可能程度,而频数告诉我们数值出现的频繁程度。频数越高,数值出现的概率越大。由于在最初的20分钟内,朱莉的等待时间的频数为常数,这意味着概率密度函数也是常数。

连续概率

概率 = 面积

连续随机变量的概率通过面积表示。为了求出一个特定数值范围的概率,首先可画出概率密度函数,位于函数图形下方且介于这个特定数值范围之间的面积就是这个特定数值范围的概率。

例如,我们想求出朱莉为了见到约会对象而等待5-20分钟的概率,可以画出概率密度函数,再求出位于这个概率密度函数下方且x值介于5-20之间的面积。

在这里插入图片描述

线下总面积必须等于1,因为总面积代表总概率 — 对于任何概率分布来说,总的概率必须等于1,因此面积也必须等于1。

在这里插入图片描述

刚好特例中的f(x),也就是概率密度函数是一条直线,也就是常数,我们可以直接利用长方形的面积,已知长(20-0),求宽(1/20=0.05)。

之后我们就可以求出P(X>5)了, P ( X > 5 ) = ( 20 − 5 ) ∗ 0.05 = 0.75 P(X>5) = (20-5)*0.05=0.75 P(X>5)=(205)0.05=0.75

所以,朱莉等待5分钟以上的概率为0.75。


为了求出连续概率,可不能再用离散概率的方法那样,把数值一个个求概率再加起来。因为连续概率的数值个数是无穷无尽的,如果求和会无休无止。对于连续概率分布的时候,唯一的办法就是算出由连续概率函数形成的曲线下方的面积。

问:有一种函数叫做概率密度函数,那么什么是概率密度?

答:概率密度指出各种范围内的概率的大小,通过概率密度函数进行描述。它与我们在第一章碰到过的频数密度十分相似。概率密度通过面积标示概率大小,而频数密度通过面积标示频数大小。

问:难道概率密度和概率不是一回事?

答:概率密度是一种表示概率的方法,但它并非概率本身。概率密度函数是图形中的一条线条,而概率则是这条线下方的一定数值范围内的面积。

问:必须通过计算面积求概率…这是不是搞复杂了?我是说,要是概率密度函数是一条曲线,而非直线,那该怎么办?

答:还是行得通,但需要用到微积分,因此本书不打算让你进行这类计算。问题的关键是,要明白概率的来历,以及如何理解这种概率。
如果你实在对通过微积分计算概率感兴趣,无论如何都想试试,请大胆尝试,放手去学吧。

问:关于概率范围,你已经讲过不少。我如何求出一个精确数值的概率?

答:在处理连续数据的时候,实际上考虑的是一个可以接受的精度,并且基于这些数值形成一个范围。让我们看一个例子:

假定你想要一段丝线,长度10英寸,精确到英寸。虽然“你需要一段正好长10英寸的丝线”这种说法最容易脱口而出,但这并不完全正确。你真正想要的是一段长度介于9.5英寸到10.5英寸之间的丝线,因为你想让这段 10 英寸长的丝线“精确到英寸”即,你想求出长度介于9.5英寸到10.5英寸这个范围内的概率。

问:如果我想求某一个精确的数值的概率,会是多少?

答:结果为0 一 猛一听可能会觉得有违直觉,但你的问题其实可以这样理解:求一个具有无穷小数位数的精确数值的概率。

让我们再以丝线长度为例:如果你需要一段长度正好等于10英寸的丝线,会出现什么局面?一你会需要用一台高倍放大镜,以原子大小为精度,量出一段10英寸长的丝线。“丝线的长度正好为10英寸”这个事件基本上不可能发生。也就是其概率为零

连续概率例题:

在这里插入图片描述

要点:

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值