笔记：《深入浅出统计学》第八、九章：概率密度、正态分布(高斯分布)

最新推荐文章于 2022-05-01 20:02:28 发布

余欲与鱼语渔

最新推荐文章于 2022-05-01 20:02:28 发布

阅读量1.3w

点赞数 2

分类专栏：《深入浅出统计学》

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45671758/article/details/106964780

版权

《深入浅出统计学》专栏收录该内容

14 篇文章 8 订阅

订阅专栏

离散数据由单个数值组成，连续数据包含一个数据范围。

1.概率密度：

连续随机变量的概率分布可用概率密度函数描述。

概率密度是一种表示概率的方法，并非概率本身。概率密度指出各种范围内的概率的大小，通过概率密度函数进行描述
概率密度函数是图形中的一条线条，而概率则是这条线下方的一定数值范围内的面积。
类似于频数密度，概率密度通过面积表示表示概率，频数密度通过面积表示频数。
满足条件的面积即为所求概率，图形总面积必须等于1。
对于连续概率，必须通过计算概率密度曲线下方的面积得出概率。

2.正态分布——连续型数据的“理想模型”

正态分布具有对称钟形曲线，中央部位的概率密度最大，均值和中位数众数均位于中央位置。

X~N(μ, σ²)：连续随机变量X服从均值为μ，标准差为σ的正态分布。
μ指出曲线中央位置，σ指出分散性，σ越大，图像越扁平，概率永远不等于0。
正态概率计算步骤：

确定分布参数与需求范围
标准化为Z~N(0, 1)：
先移动均值，使μ=0；然后收窄方差Z=(x-μ)/σ
利用标准分Z，用概率表查找概率
注意：概率表通常只给出P(Z<=z)形式的概率，注意灵活转化

用正态分布代替二项分布(当nq和np都大于5时)

如果随机变量X服从X~B(n,p)二项分布，且np和nq都大于5时，则可用X~N(np, npq)近似代替。
连续性修正：在计算前，将离散数值转换为连续标度时，范围数值必须进行连续性修正(下限加0.5，上限减0.5)
注意：如果区间是带等号，先消除等号再连续性修正，例如X<=10——X<11——X<10.5

用正态分布代替泊松分布(当λ大于15时)

如果X~Po(λ)，且λ大于15，则可用X~N(λ，λ)近似代替。
注意连续性修正

余欲与鱼语渔

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。