用R语言学习数据挖掘——4.随机变量及其分布（二项分布）

最新推荐文章于 2023-07-17 21:01:59 发布

咕噜oo

最新推荐文章于 2023-07-17 21:01:59 发布

阅读量6.3k

点赞数 3

分类专栏： # R语言文章标签：数据挖掘机器学习大数据 R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44081582/article/details/109124127

版权

本文介绍了随机变量的概念，包括离散型和连续型分布，重点讲解了均匀分布、伯努利分布以及二项分布。通过R语言的rbinom函数展示了如何进行伯努利实验模拟，并通过绘图展现了不同实验次数下的二项分布概率密度。

摘要由CSDN通过智能技术生成

目录

伯努利分布

rbinom(n,size,prob)

随机变量X(random variable)表示随机试验各种结果的实值单值函数。

描述一个随机变量，不仅要说明它能够取哪些值，而且还要关心它取这些值的概率。因此，引入随机变量的分布函数概念。

对每个随机变量X和每个实数集合A，可以计算X取A中值的概率。所有这些概率的集合就是随机变量X的分布。

随机变量以及分布函数主要有两类：离散型分布和连续型分布。

离散型分布：当X只能取有限个不同值x1,x2,……Xk时，我们称随机变量X服从一个离散型分布。X称为离散型随机变量。比如用随机变量X代表抛一枚硬币的结果，则此时X是离散型随机变量。因为X只能取0或1（正面或背面）。
连续型分布：对实轴的任意子集A，随机变量X落在A中的概率是f在A上的积分，那么我们说X服从连续型分布或者X是连续型随机变量。一般我们都是讨论X落入子集A的区间[a,b]的概率，则记为：

如图：

如果对整个曲线做积分，相当于求整个曲线和x轴围成的面积。所以结果是1。所以上式在图中，相当于求a,b区间出现的概率。针对连续型分布，求一个点的概率是没有意义的（因为面积是0，即概率是0），所以要求一个区间的概率。

常用的数据分布有如下几种：

常见的一元离散型分布：整数型均匀分布二项分布泊松分布几何分布超几何分布
常见的一元连续型分布：实数型均匀分布正态分布(高斯分布） γ(伽玛)分布指数分布贝塔分布
多元离散型分布：多项式分布
二元连续型分布：二元正态分布
还有其

最低0.47元/天解锁文章

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。