样本有偏时的思考

如何避免样本抽样有偏的情况发生

在关联规则中,对于辛普森悖论的出现,即是由于样本有偏所导致规则提取的错误,在进行抽样时,如果没有比较客观地反映原始总体的信息,那么基于此,所得到的统计分析的结论以及假设检验,都是有错误的。

对于这个问题的解决方案,

1,  多次抽样,将多次抽样的分布绘制出来,取相对集中部分的均值或者众数

2,  对于大的样本按照可利用的商业信息进行分层,再按照恰当比例在每个层中进行抽样。

3,  对于抽样而言,很多情况下,我们想要利用的是,利用样本估计总体,那么如果我们已经可以估计出样本密度函数,那么就可以解决总体估计问题。这里可以利用非参数估计,如:矩估计,ML估计,分位数估计等方法进行样本估计,而对于样本有偏的情况时,对相应的估计进行适当地调整来比较完整地反映总体信息。

     个人感觉,我的思路有很大局限性,欢迎大牛和大侠,批评指正,指点迷津!!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值