显著性测试,p-value/p值

p-value的意义就是当前模型要显著的好于别的模型,
先计算chi-square值,然后根据值去查卡方图,得到p-value值,大于0.05(经验值),则说明拒绝假设H0的概率小,H0成立。比如硬币真假,如果7次反面,3次正面,计算chi-square的值为1.7,根据卡方图,p值介于0.25~0.1之间,大于0.05,则为真币。算法模型中,可以比较logloss,auc,如果p-value远远小于0.05,则说明baseline的表现更好不成立,对应新模型表现更好。
实验的python代码如下:

baseline = {'aaa': [0.20799, 0.20871, 0.21037, 0.211, 0.21215],
            'bbb': [0.20632, 0.20565, 0.20459, 0.20436, 0.2042],
            'ccc': [0.22306, 0.22286, 0.22138, 0.2215, 0.22064],
            'ddd': [0.22195, 0.22168, 0.22208, 0.22172, 0.22238],
            'eee': [0.2131, 0.21311, 0.2116, 0.21078, 0.2113],
            'fff': [0.20759, 0.20763, 0.20672, 0.2067, 0.20612]}
ggg = [0.22379, 0.22338, 0.22321, 0.22226, 0.22281]

for name in baseline.keys():
    base_result = baseline[name]
    t, p = ttest_ind(base_result, ngcf)
    print(name, p)
  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值