临床试验中的样本量估算---实践篇

# -*- coding: utf-8 -*-
class SampleSizeCalculator:
    def __init__(self, alpha=0.05, beta=0.1, sigma=None,
                 delta=None, is_one_sample=False, is_one_side=False):

        self.alpha = alpha # 显著水平,假设检验中犯第一类错误的概率
        self.beta = beta # 假设检验中犯第二类错误的概率
        self.power = 1 - beta # 检验效能
        self.sigma = sigma # 标准差
        self.delta = delta # 可容忍误差
        self.is_one_sample = is_one_sample # 单样本 or 双样本
        self.is_one_side = is_one_side # 单侧检验 or 双侧检验

    # Method1: 通过公式计算样本量
    def get_sample_size1(self):
        import math
        from scipy.stats import norm, t

        # sigma为总体方差时
        if self.is_one_side:
            z_percent_alpha = norm.ppf(self.alpha, 0, 1)
        else:
            z_percent_alpha = norm.ppf(self.alpha / 2, 0, 1)
        z_percent_beta = norm.ppf(self.beta, 0, 1)

        if self.is_one_sample:
            z_test_num = (z_percent_alpha + z_percent_beta) ** 2 * (self.sigma / self.delta) ** 2
            z_test_num = math.ceil(z_test_num)
            if self.is_one_side:
                t_percent_alpha = t.ppf(self.alpha, z_test_num - 1)  # 单样本T检验的自由度为n-1
            else:
                t_percent_alpha = t.ppf(self.alpha / 2, z_test_num - 1)  # 单样本T检验的自由度为n-1
            t_percent_beta = t.ppf(self.beta, z_test_num - 1)
            t_test_num = (t_percent_alpha + t_percent_beta) ** 2 * (self.sigma / self.delta) ** 2
        else:
            z_test_num = 2 * (z_percent_alpha + z_percent_beta) ** 2 * (self.sigma / self.delta) ** 2
            z_test_num = math.ceil(z_test_num)
            if self.is_one_side:
                t_percent_alpha = t.ppf(self.alpha, 2*z_test_num - 2)  # 双样本T检验的自由度为n1+n2-2
            else:
                t_percent_alpha = t.ppf(self.alpha/2, 2*z_test_num - 2)  # 双样本T检验的自由度为n1+n2-2

            t_percent_beta = t.ppf(self.beta, 2*z_test_num - 2)
            t_test_num = 2 * (t_percent_alpha + t_percent_beta) ** 2 * (self.sigma / self.delta) ** 2

        return t_test_num



    # Method2: 通过三方库计算样本量
    def get_sample_size2(self, k):
        if self.is_one_sample:
            from statsmodels.stats.power import TTestPower
            ttest = TTestPower()
            if self.is_one_side:
                alternative = "larger"
            else:
                alternative = "two-sided"
            t_test_num = ttest.solve_power(effect_size=self.delta / self.sigma,
                                           alpha=self.alpha,
                                           power=self.power,
                                           alternative=alternative)
        else:
            from statsmodels.stats.power import TTestIndPower
            ttest = TTestIndPower()
            if self.is_one_side:
                alternatives = "larger"
            else:
                alternative = "two-sided"
            t_test_num = ttest.solve_power(effect_size=self.delta / self.sigma,
                                           nobs1=None,
                                           alpha=self.alpha,
                                           power=self.power,
                                           ratio=k,
                                           alternative=alternative)
        return t_test_num


if __name__ == "__main__":
    alpha = 0.05
    beta = 0.02
    sigma = 8
    delta = 5
    is_one_sample = True
    is_one_side = True

    sample_size_calculator = SampleSizeCalculator(alpha=alpha,
                                                  beta=beta,
                                                  sigma=sigma,
                                                  delta=delta,
                                                  is_one_sample=is_one_sample,
                                                  is_one_side=is_one_side)

    sample_size1 = sample_size_calculator.get_sample_size1()
    print(sample_size1)
    sample_size2 = sample_size_calculator.get_sample_size2(k=1)
    print(sample_size2)
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 样本量估算公式一般是按照总体参数的精确度和样本容量的大小来确定的,一般公式为:n=(zα/2/ε)2*σ2/d2,其,zα/2是置信度为α时的临界统计量,ε是所允许的误差,σ2是总体方差,d2是所期望的精确度。 ### 回答2: 统计样本量估算是指通过计算确定在给定置信水平和预设精度下,需要多少个样本才能得出具有一定可靠性的结论。 样本量估算的公式可以根据不同的统计方法和研究目的而有所差异,下面是一个常用的样本量估算公式: n = (Zα/2)^2 * p * (1 - p) / e^2 其, n代表样本量的大小, Zα/2代表在置信水平为α下的标准正态分布的分位数, p是研究某个现象或特征在总体出现的概率或比例, e是允许的误差,即预设的样本估计值与总体真值之间的最大差异。 这个公式的计算步骤如下: 1. 确定研究的置信水平和预设精度,一般常用的置信水平为95%或99%,预设精度一般根据研究的要求来确定。 2. 查找标准正态分布表,找出在置信水平为α下的分位数Zα/2。 3. 估计总体的概率或比例p,可以通过历史数据或先前的研究结果得到。 4. 确定允许的误差e,一般根据研究的需求和可接受的误差范围来确定。 5. 根据上述参数代入样本量估算公式,计算出所需的样本量n。 在实际研究样本量估算对于统计分析的准确性和结果的可靠性至关重要。样本量估算的准确性取决于对总体特征的了解和准确估计,同时需要综合考虑实际可行性和研究成本等因素,确保得到具有一定可靠性的结论。 ### 回答3: 样本量估算公式是用于确定在进行统计调查或实验时需要收集的样本数量的计算公式。样本量的大小直接影响到统计结果的准确性和可靠性,因此合理地估计样本量是非常重要的。 一种常用的样本量估算公式是根据总体的特征值和期望的抽样误差来计算的。该公式如下: n = [(Z * σ) / E]^2 其,n表示所需的样本量,Z是选择的信心水平对应的标准正态分布的分位数,σ是总体的标准差,E是期望的抽样误差。 该公式的基本思想是,通过选择合适的信心水平和期望的抽样误差,根据总体的标准差来确定所需的样本大小。标准正态分布的分位数Z与信心水平有关,一般常用的是95%信心水平,对应的Z值约为1.96。总体的标准差σ可以通过已知数据或者进行样本调查获得。 需要注意的是,该公式是一个近似计算的方法,结果只是一个估计值,具体的样本量还需要结合实际情况进行调整。此外,不同的研究目的和方法也可能使用其他的样本量估算公式。 综上所述,样本量估算公式是在统计调查和实验确定所需的样本数量的一种计算方法,可以通过总体的特征值和期望的抽样误差来进行估计。该公式可以作为一个参考,帮助研究者在实践选择合适的样本量以保证统计结果的准确性和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值