用R语言学习数据挖掘——4.随机变量及其分布(二项分布)

本文介绍了随机变量的概念,包括离散型和连续型分布,重点讲解了均匀分布、伯努利分布以及二项分布。通过R语言的rbinom函数展示了如何进行伯努利实验模拟,并通过绘图展现了不同实验次数下的二项分布概率密度。
摘要由CSDN通过智能技术生成

目录

均匀分布

伯努利分布

二项分布

rbinom(n,size,prob)


随机变量X(random variable)表示随机试验各种结果的实值单值函数。

描述一个随机变量,不仅要说明它能够取哪些值,而且还要关心它取这些值的概率。因此,引入随机变量的分布函数概念。

对每个随机变量X和每个实数集合A,可以计算X取A中值的概率。所有这些概率的集合就是随机变量X的分布。

随机变量以及分布函数主要有两类:离散型分布连续型分布

  • 离散型分布:当X只能取有限个不同值x1,x2,……Xk时,我们称随机变量X服从一个离散型分布。X称为离散型随机变量。比如用随机变量X代表抛一枚硬币的结果,则此时X是离散型随机变量。因为X只能取0或1(正面或背面)。
  • 连续型分布:对实轴的任意子集A,随机变量X落在A中的概率是f在A上的积 分,那么我们说X服从连续型分布或者X是连续型随机变量。一般我们都是讨论X落入子集A的区间[a,b]的概率,则记为:

如图:

如果对整个曲线做积分,相当于求整个曲线和x轴围成的面积。所以结果是1。所以上式在图中,相当于求a,b区间出现的概率。 针对连续型分布,求一个点的概率是没有意义的(因为面积是0,即概率是0),所以要求一个 区间的概率。

常用的数据分布有如下几种:

  • 常见的一元离散型分布: 整数型均匀分布 二项分布  泊松分布  几何分布  超几何分布
  • 常见的一元连续型分布: 实数型均匀分布 正态分布(高斯分布) γ(伽玛)分布  指数分布  贝塔分布
  • 多元离散型分布: 多项式分布
  • 二元连续型分布: 二元正态分布
  • 还有其
  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值