Sas应用之总体概率的参数估计

最新推荐文章于 2020-09-03 17:00:28 发布

flyingool

最新推荐文章于 2020-09-03 17:00:28 发布

阅读量3.4k

点赞数

分类专栏： SAS应用分析文章标签： SAS 数据分析

本文链接：https://blog.csdn.net/linuxpassion/article/details/51902658

版权

SAS应用分析专栏收录该内容

8 篇文章 3 订阅

订阅专栏

抽样误差：由于生物固有的个体差异的存在，从总体中随机抽取一个样本，所得样本统计量与总体参数往往是不同的，这种差异称为抽样误差。标准误可以用来衡量抽样误差的大小。在本文中主要介绍总体概率的参数估计。如某新药治疗100例脑血管梗塞患者，其中80例有效，标准药物治疗100例，其中83例有效，试估计新药治疗的有效概率，比较两组药物的有效率有无差别？
原理：根据二项分布原理，若随机变量X~B（n, π）,则样本频率p=X/n的总体概率π，标准误为

。在实际工作中，常用p代替π近似计算标准误。
当n足够大，一般是≥50，且np及n(1-p)均大于5时，p的抽样分布近似正态分布，总体概率的π的双侧（1-α）置信区间近似等于（p-Zα/2
Sp
,p+Zα/2
Sp
）,则上述例子中新药的有效概率统计量为0.8，标准误为

为0.04，总体有效率95%的置信区间为（0.8-1.960.04,0.8+1.960.04），最后结果为（0.7216,0.8784），用了加减乘除、power函数等费了九牛二虎之力将总体概率的区间估计给计算出来了。
听一些人讲SPSS没法直接算概率的置信区间，每次都需要手动计算，一组计算还行，但是在实际工作中往往需要计算多组的概率的置信区间，那么sas有没有简便的语句可以实现？
答案：当然是肯定的，程序如下：
/建立上述分析数据集/
data test;
do medi="new","sta";
do results="effective","noeff";
input x@@;
output;
end;
end;
cards;
80 20
83 17
;
run;
/计算p和总体概率置信区间并输出结果到results数据集/
proc **freq data=test;
weight x;
tables results/binomial;
by medi;
output out=results bin; run**;

这里需要解释的是， sas默认计算的概率为结果（results）升序排列第一个结果的概率，在本例中results="effective","noeff";升序排列时，effective在noeff的前面，因此计算的是有效概率，需要计算无效概率，需要调整结果名称如“Y”或”N”，升序排列时，N字母在Y之前，因此计算N的概率。当然数字调整是最简单的，想计算哪种结果的概率，直接定义其结果为1，其他为2。binomial计算样本概率和估计总体概率置信区间。ALPHA=定义α值。结果如下：

作者：任丽
编辑：乘物以游心
发布范围：微信、简书、CSDN
微信号： sas应用分析
原文链接：https://mp.weixin.qq.com/s?__biz=MzIyNTE2MzM3MA==&mid=2650116643&idx=1&sn=e13426d7dff548f22a8bf03c27cc4d94&scene=0#rd

flyingool

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Sas应用之总体概率的参数估计

抽样误差：由于生物固有的个体差异的存在，从总体中随机抽取一个样本，所得样本统计量与总体参数往往是不同的，这种差异称为抽样误差。标准误可以用来衡量抽样误差的大小。在本文中主要介绍总体概率的参数估计。如某新药治疗100例脑血管梗塞患者，其中80例有效，标准药物治疗100例，其中83例有效，试估计新药治疗的有效概率，比较两组药物的有效率有无差别？原理：根据二项分布原理，若随机变量X~B（n, π）,
复制链接

扫一扫

专栏目录