均匀分布取某一点概率_概率分布,先懂这6个

本文介绍了数据分析中常用的六种概率分布:伯努利、均匀、二项式、正态、泊松和指数分布,解释了它们的特点和应用场景,帮助读者理解如何在实际问题中运用这些分布。
摘要由CSDN通过智能技术生成

此文是《10周入门数据分析》系列的第9篇

想了解学习路线,可以先阅读“ 学习计划 | 10周入门数据分析 ”


本文重点介绍分析中常用的六个重要分布,并解释它们的应用。

假设你是一所大学的老师。在对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据录入人员,并告诉他创建一个包含所有学生成绩的电子表格。但这个人却只存储了成绩,而没有包含对应的学生。

他又犯了另一个错误,在匆忙中跳过了几项,但我们却不知道丢了谁的成绩。我们来看看如何来解决这个问题吧。

一种方法是将成绩可视化,看看是否可以在数据中找到某种趋势。

ce560c3563f21f885036c4a2a4e0d34e.png

上面展示的图形称为数据的频率分布。其中有一个平滑的曲线,但你注意到有一个异常情况了吗?在某个特定的分数范围内,数据的频率异常低。所以,最准确的猜测就是丢失值了,从而导致在分布中出现了凹陷。

这个过程展示了你该如何使用数据分析来尝试解决现实生活中的问题。对于任何一位数据科学家、学生或从业者来说,分布是必须要知道的概念,它为分析和推理统计提供了基础。

虽然概率为我们提供了数学上的计算,而分布却可以帮助我们把内部发生的事情可视化。

在本文中,我将介绍一些重要的概率分布,并会清晰全面地对它们进行解释。

常见的数据类型

在开始详细讲述分布之前,先来看看我们会遇到哪些种类的数据。数据可以分为离散的和连续的。

离散数据:顾名思义,只包含指定的值。例如,当你投骰子的时候,输出结果只可能是1、2、3、4、5或6,而不可能出现1.5或2.45。

连续数据:可以在给定的范围内取任何值。范围可以是有限的,也可以是无限的。例如,女孩的体重或身高、路程的长度。女孩的体重可以是54千克、54.5千克,或54.5436千克。

现在开始学习分布的类型。

分布的类型

1、伯努利分布

从最简单的分布伯努利分布开始。

伯努利分布只有两种可能的结果,1(成功)和0(失败)。因此,具有伯努利分布的随机变量X可以取值为1,也就是成功的概率,可以用p来表示,也可以取值为0,即失败的概率,用q或1-p来表示。

概率质量函数由下式给出:px(1-p)1-x, 其中x € (0, 1)。它也可以写成:

23f285161e207507eab0b6c420ddffe0.png

成功与失败的概率不一定相等。这里,成功的概率(p)与失败的概率不同。所

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值