Probability Distribution

概率分布也是我们说的随机变量分布,他有两种分类的方式:


连续和离散

根据可能得到的结果类型来进行分类:

如果得到的结果是离散的,比如投硬币或者掷骰子结构都是离散的,这样的概率分布是离散型概率分布

常见的离散型概率分布有:伯努利分布,二项分布,多项分布,泊松分布,超几何分布

如果得到的结果是在一个连续的范围内(例如实数),比如一天的温度或降水量,这样的概率分布是连续型概率分布

常见的连续型概率分布有:正态分布,卡方分布、Beta分布,狄利克雷分布,伽马分布


单变量和多变量

根据样本空间进行分类:

  • 单变量 univariate probability distributions

单变量分布给出了一个随机变量接受不同备选值的概率;

常见的单变量概率分布有:二项分布,超几何分布;正态分布,Beta分布

  • 多变量 multivariate probability distributions

多变量分布(联合概率分布)给出了一个随机向量(两个或多个随机变量的列表)接受不同组合值的概率。

常见的多变量分布有:多项式分布;狄利克雷分布

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
概率分布估计是指利用已有的数据样本来推断未知的概率分布函数的过程。概率分布估计在统计学、机器学习和数据分析等领域中都有广泛的应用。常见的概率分布包括正态分布、泊松分布、指数分布、伽马分布等。 在R语言中,可以使用一些函数来进行概率分布估计,这些函数包括: - fitdistr():用于拟合一般的单峰连续分布和单峰离散分布的参数。 - density():用于估计分布的概率密度函数。 - ecdf():用于估计累积分布函数。 - hist():用于绘制直方图,可以从直方图中大致了解数据的分布情况。 以下是一些具体的使用示例: ```r # 生成一个正态分布的随机数 x <- rnorm(1000) # 用fitdistr函数拟合正态分布的参数 library(MASS) fit <- fitdistr(x, "normal") mean <- fit$estimate[1] sd <- fit$estimate[2] # 用density函数估计正态分布的概率密度函数 pdf <- density(x) # 用ecdf函数估计正态分布的累积分布函数 cdf <- ecdf(x) # 用hist函数绘制正态分布的直方图 hist(x, breaks=30, freq=FALSE, main="Normal Distribution") curve(dnorm(x, mean=mean, sd=sd), col="blue", lwd=2, add=TRUE) ``` 在上述代码中,首先使用rnorm函数生成一个正态分布的随机数,然后使用fitdistr函数拟合正态分布的参数。接下来,使用density函数估计正态分布的概率密度函数,使用ecdf函数估计正态分布的累积分布函数。最后,使用hist函数绘制正态分布的直方图,并使用curve函数将正态分布的概率密度函数叠加在直方图上进行比较。需要注意的是,在使用fitdistr函数拟合参数时,需要先加载MASS包。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值