pass样本量_年度质量回顾-样本量

26e90977f5be408d633dd2520a24cb78.png

上一篇文章讨论了μ±3σ统计分析的限制前提:正态分布。本篇将继续讨论限制μ±3σ统计分析方法的另一个因素:样本量。

1 案例

某原料药中间体含量(%,限度96.5-103.5)统计数据如下:

430e7844c478631bc1cb018419897108.png
中间体含量-10批

首先进行正态判定,结果显示:不能拒绝正态。

a43927cf12e99f935944a7f189acc130.png
含量数据正态性检验

然后进行μ±3σ分析,结果显示:所有数据均在μ±3σ计算的控制限度内,但控制下限低于规格限度,NO PASS!

f130831e25c15d7c6c8740bd39d854ea.png
含量Xbar控制图-10批

随着时间的推移,生产批次不断增加,继续统计数据并进行μ±3σ分析,结果显示:所有数据均在μ±3σ计算的控制限度内,且控制限度低于规格限度,PASS!

8545c5ca4516cd3a9c801335943db03c.png
中间体含量-20批

aa79c89c00cda6655ec5c864c2e7dec2.png
含量Xbar控制图-20批

增加样本数量至30,再次进行分析,结果显示:数据均在μ±3σ计算的控制限度内,且控制限度低于规格限度, PASS!

65d5d283d701d3f0ea1f046a091b67f6.png
中间体含量-30批

4586e64a204c10ee462f2ace0193fbec.png
含量Xbar控制图-30批

2 WHY

数据均为正态,怎么又出现了不同的结论!

现在,回到问题的本质。

2.1 定性-点估计

上述案例实际采用的是控制限

,用样本均值
估计总体均值u,用样本标准差s估计总体标准差σ。
点估计不能保证每次估计参数u、s 均是无偏差的!

对于正态总体,用

估计u的标准差
(1)

用s估计σ的标准差

(2)。

可见,n越大,σ越小,对控制限度估计精度越大,越可信。

2.2 定量-边际误差

公式1~2中,包含参数σ未知,而σ从样本数据中是得不到的。如果以s代替σ计算,该如何解释呢,幸运的是,边际误差[1]解决了这一问题。

总体均值u估计的边际误差

(3)。

总体标准差σ估计的边际误差

(4)。

可见:n越大,s越小,边际误差越小,控制限估计精度越大,越可信。

2.3 样本量n=30

传统的大样本“n=30”就足够了吗?

对于正态总体,置信水平均为0.95,根据公式3~4计算的总体均值和标准差的双侧置信区间的边际误差数据如下:

4740ecfde1af697b49d09c5a54840385.png
置信水平分别为0.95的双侧置信区间的边际误差

表中数据显示:如果s=5.0,n=30,对应的均值和标准差的边际误差分别为1.867和1.722,显然在中间体含量的控制限度估计上,将出现较大的误判率。

3 HOW

n越大,越可信,那么取多大样本量估计是合适的?

对于“老”产品,可以采用稳定生产的同一生产线历史均值和标准差作为μ和σ的估计,进行μ±3σ分析。

对于“新”产品,可以通过初步的推测或之前的试验研究,得到标准差的推测值,根据能够接受的产品质量属性和工艺属性的误差接受程度[2]选择合适的样本量。

在考虑提高精度的时候,应兼顾样本量和成本之间的平衡关系。

4 小结

μ±3σ分析进行正态判定后,还应选择合适的样本量。

样本量n=30仅为经验数值,如果标准差很大,统计分析将出现较大的误判率。

同一总体,n越大,控制限估计精度越大,越可信,但成本控制必须在视野之内。

参考

  1. ^对于双侧置信区间,边际误差为估计统计量与每个端点之间的距离
  2. ^一般来说,杂质、含量、收率等接受程度依次变大
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值