分层抽样不按比例如何加权_数据管理 之 数据加权

简介

在市场研究、社会研究等数据过程中,都会涉及到数据加权的问题。但具体来说,什么是数据加权呢?

简单来说,就是就是在某些数据上增加或减少权重,让部分样本看起来重要或者不重要,或者让所调研的样本更符合市场现状,尤其是人口现状。这是在市场研究、社会研究、医学研究中经常遇到的事情。

由此来看,数据加权适用于以下几种情况:

情景1:在抽样调查得到的样本结构与总体人口统计结构状况不相符,在数据处理时,可以通过加权来消除/还原这种结构差异,达到纠偏的目的。

  • 例如,在城市和农村各调查300样本,城市与农村人口比例“城市:农村=1:2”(假设),在分析时我们希望将城市和农场看作一个整体,这时候我们就可以赋予农村样本一个2倍于城市样本的权重。

情景2:除了人口统计结构,有时在调查样本的某些变量或指标上样本的代表性可能也会相对总体的实际状况过高/过低,此时,需要加权进行调整。

  • 这类不匹配大多是“故意”而为(通过“追加”样本实现),比如在配额抽样的时候,设置配额要求某类被访者对某产品的使用者必须达到50%,但实际情况是总体市场中实际使用者仅有10%。
  • 有时,则是“非情愿”的出现,比如设置了能反映总体的配额比例,但实际操作却出现了比例偏高/偏低。

情景3:在样本组配额实验设计中,进行不同子总体对比检验,也会通过加权来调整不同组间的样本属性不相匹

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值