统计分布学习笔记(未完)

421 篇文章 15 订阅


前一篇文章列出了SAS概率统计相关的主要函数,本部分本来计划介绍如何通过SAS函数模拟分布来学习,结果发现,这方面的相关资料除了下面列的参考书,几乎没有,并且实现起来也比较困难,另外,IML也不熟悉,SAS还是留着做它擅长的数据处理和统计分析吧。于是乎,改弦易辙,计划使用R来模拟统计分布。从自己的使用心得来说,R比较适合做教学科研,SAS比较适合做商业项目。

原计划参考文献:Xitao Fan, etc..Monte Carlo Studies: A Guide for Quantitative Researchers. SAS Institute Inc.,2002


研究分布的重要性:(Fisher,1922)把数理统计的任务概括为3条:(1)Specification,确定模型,即确定样本分布;(2)Estimation,用样本估计模型中的未知参数;(3)Sampling Distribution,抽样分布(统计量的分布)。因此,有必要好好研究下样本分布及抽样分布。首先,介绍如何通过随机数,产生不同的统计分布;其次研究统计分布的一些性质。

在收集资料的时候,发现已经有同道中人,把我想整理的材料系统全面的整理好了,直接上链接地址,

常用连续型分布介绍及R语言实现 http://blog.fens.me/r-density/


下面的内容,仅收集整理我感兴趣的内容。

(一)统计分布模拟

一维

(1)离散型分布

二项分布

【背景介绍】

二项分布即重复多次的伯努利实验,是最重要的离散型概率分布之一。de Moivre在1733年发表的卓越论文中使用正态分布去估计大量抛掷硬币出现正面次数,Laplace扩展了de Moivre的理论,指出二项分布可用正态分布逼近。

棣莫佛-拉普拉斯(de Movire - Laplace)定理是中心极限定理的最初版本,讨论了服从二项分布的随机变量序列。它指出,参数为n, p的二项分布以np为均值、np(1-p)为方差的正态分布为极限。高尔顿板可以看作是伯努利试验的实验模型

【模拟】

方法一:产生n个来自二项分布的随机数,再用hist频数显示。

rbinom(n, size, prob) 产生n个b(size,prob)的二项分布随机数,size是实验次数(number of trials)

hist()

方法二:直接产生二项分布的概率密度函数,再用plot方式显示

dbinom(x, size, prob, log = FALSE)

plot()

【分布拟合检验】

根据二项分布的特点,当n较大时趋近正态分布,当n较大,p较小时,趋近泊松分布。可以,设置参数的变化,检验这两个性质。



(2)连续型分布

(二)统计分布性质研究



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值