全国市场调查大赛经验分享(三)

这一篇主要介绍在市场调查大赛中可以用到的抽样调查步骤、抽样方法(概率抽样、非概率抽样)还包括一些概念的理解。本文内容主要参考金勇进老师的《抽样技术》一书,感兴趣的同学们可以详细学习一下。

基本概念

我们首先来明确几个抽样调查中的概念。

抽样调查是指从研究对象的全体(总体)中抽取一部分作为样本。根据对样本进行调查获取数据,并进行统计分析,获取有关总体的了解的过程!

当对社会性问题进行抽样调查时,就是社会调查,例如:对社会经济现象和社会性民意调查;当应用于消费者市场问题时,就是市场抽样调查。

研究对象是在调查中要描述和分析的对象,研究对象的全体称为目标总体。例如:在研究江苏省青岛啤酒消费者行为时,研究对象就是江苏省青岛啤酒的消费者。

抽样总体是指从中抽取样本的总体。通常情况下,抽样总体应与目标总体完全一致,但实践中两者不一致的情况时有发生。例如:在研究江苏省青岛啤酒消费者行为时,作为学生的我们无法获得所有江苏省青岛啤酒消费者的抽样框,此时我们的抽样总体肯定是要尽可能覆盖所有江苏省青岛啤酒消费者,但也只能是在力所能及范围内,此时chou'yang抽样总体与目标总体就产生了偏差。

调查对象是在调查时所询问的对象,搜集研究对象资料的提供者。例如:在研究江苏省青岛啤酒消费者行为时,调查对象就是我们实际调查到的(收集到信息的)江苏省青岛啤酒的消费者。

抽样调查的一般步骤

一,确定研究对象和研究问题。这是整个调查的第一步,也是至关重要的一步,在这个过程中,首先要明确的定义问题,只有把问题定义清楚,才有可能展开进一步的设计和执行。在这一过程中,还要考虑到团队财力限制及有关的调查技术力量,把调研的问题定义在适当的范围内。(研究江苏省青岛啤酒消费者的消费行为及动机)

二,确定抽样方案获取样本。抽样方案要描述样本是如何抽取的。在制定抽样方案时,既要考虑方法的科学性,又要考虑实际的可行性。在这个过程中,还要确定样本量,要给出与抽样设计相匹配的总体参数的估计公式及估计量的精度公式。(关于确定样本量的计算公式,大家可以通过查阅文献找到一些思路)

三,问卷设计。问卷设计是根据调查目的和要求,将比较抽象的调查问题逐步细化演变为现场调查中向受访者询问的比较具体的问题的工作过程,一份设计涉密的问卷应当使受访者能准确无误的理解调查的内容,愿意回答并且正确回答所提的问题,同时,使调查机构便于对问卷进行计算机处理有效的利用调查数据进行统计分析。(团队成员要对问卷用词进行反复斟酌,避免出现歧义或者受访者无法作答的问题)

四,实施抽样调查过程。在这个过程中,要获得样本单元的调查数据,关键的问题是要保证原始数据的质量,这就需要对调查过程进行有效的管理和监控。如果调查项目比较大,又是首次进行,或者对问卷设计的把握性不够大,在正式调查实施前,还应当进行一次预调查,以检验各方面的工作是否完善。(通常是通过问卷网、问卷星之类的平台进行问卷发放及收集,也可以采用实地调查等方法,后面有其他调查方法的详细介绍)

五,数据处理分析。在这个阶段,首先要对经过调查获得的原始数据进行检查和对验收合格的调查问卷进行编码和录入,数据录入后,多数情况下需要对数据进行预处理,为统计分析做好准备。(进行数据预处理,设置虚拟变量等)

六,撰写调查报告。调查报告可以有不同的类型,从内容上可以分为描述性报告和探索性报告,从技术角度可以分为一般性报告和技术报告,从性质上可以分为普通调查报告和学术研究报告等。

报告一般包含的主要项目有:主题、范围、调查对象、资料收集方法、调查期,参考期和报告期、抽样设计和估计程序、结论的描述、精确度、责任、参考文献、附录等。(这里建议大家多去看一些往年的获奖报告格式,不建议按照上述报告项目来写)

抽样方法的分类

抽样分类可以分成放回有序,放回无序,不放回有序和不放回无序。

放回抽样:每次从总体中抽取一个单元进行观察后,把这个单元重新放回总体,使之继续进行下一次抽选。也称回置抽样和重复抽样。放回抽样不影响后面的抽选,所以抽选各单位独立进行。

不放回抽样:每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回总体,这个总体单元不在继续参加下一次抽选,也称不回置抽样或不重复抽样。(建议大家在调查过程中使用不放回无序抽样)

根据单元入样是否遵循随机原则,可以划分为概率抽样和非概率抽样。

概率抽样:也称随机抽样,依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元抽样方法。

非概率抽样:抽取单位不遵循随机原则,而是依据研究者的主观意愿,判断是否方便等因素。

常见的概率抽样:简单随机抽样,系统抽样,分层抽样,整群抽样,多阶段抽样;常见的非概率抽样:配额抽样,随意抽样,志愿者抽样,判断抽样,滚雪球抽样等。严格来说,只有概率抽样,有资格来推断总体。

常见的非概率抽样方法

判断抽样:研究人员依据调查目的和对调查对象情况的了解,有目的的选择一些单位作为样本(人为确定样本单元),又称目的抽样。例:选择很好的或者很差的典型单元为样本。如,对山东省啤酒销售市场状况进行调查,选择燕京、雪花、青啤龙头企业进行调查。

方便抽样:在抽取样本时,依据方便原则,以达到最大限度地降低调查成本为目的。如:调查员在街头、公园、商店等公众场所进行“拦截式调查”;厂商在出售产品柜台前对路过客户顾客进行调查。

自愿样本:被调查者自愿参加成为样本中的一分子,向调查人员提供有关信息。如:参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等。

配额抽样:将总体中各单元按一定标准划分为若干类型,将样本数额分配到各类型中,从各类型中抽取样本的方法则没有严格限制,一般采用方便抽样的方法抽取样本单元。调查山东省高中生视力情况,假设此时山东省高中生男女比例为5:4,那么最终样本的男女生比例也是5:4.

滚雪球抽样:先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据提供线索进行此后调查。适合于稀少群体和特定群体的研究,如:艾滋病患者调查。

常见的概率抽样方法

简单随机抽样:也称纯随机抽样,是从抽样框内的n个抽样单元中随机的一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都相等,这n个被抽中的单元就构成了简单随机抽样样本。抽样的随机性通过抽样的随机化程序体现,随机化程序可以使用随机数表,也可以使用能产生符合要求的随机数序列的计算机程序。

例如:调查山东省居民对住房价格满意度,从所有山东省居民中随机抽取n人进行调查。

分层抽样:将抽样单元按某种特征或某种规则划分为不同的层,然后从不同的层中独立随机的抽取样本,将各层的样本结合起来,对总体的目标量进行估计。分层抽样方法保证了样本中包含有各种特征的抽样单元,样本的结构与总体的结构比较相近,可以有效的提高估计精度。

例如:调查山东省居民对住房价格满意度,将居民按市进行分层,在各市居民中分别抽取m人进行调查。

整群抽样:将总体中若干个基本单元合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。与简单随机抽样相比,整群抽样的特点在于抽取样本时只需要群的抽样框而不必要求包含所有基本单元的抽样框,这就大大简化了编制抽样框的工作量,但它的主要缺点是估计的精度较差,一般来说要得到于简单随机,抽样相同的精度,采用整群抽样,需要增加基本调查单元。

例如:调查山东省居民对住房价格满意度,将居民按职业进行分群,在各种职业的居民群中抽取h群,然后对抽到群内所有居民进行普查。

多阶段抽样:采用类似整群抽样的方法。首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,这里群是初级抽样单元,第二阶段抽取的是基本抽样单元。它保证了样本相对集中,从而节约了调查费用,不需要包含所有低阶段抽样单元的调查框,同时,由于实行了再抽样,使调查单元在更大的范围内展开。不过即便是大规模的抽样调查,抽取样本的阶段也应当尽可能的减少,因为每增加一个抽样阶段就会增添一份抽样误差,用样本对总体进行估计也更加复杂。

例如:调查山东省居民对住房价格满意度,第一阶段:将省内居民按市进行分群,在各市中抽取m个市;第二阶段:将抽到的m个市的居民继续按区进行分类,在各区中抽取k个区,...,以此类推,最终抽取目标基本单元。

系统抽样:将总体中的所有单元按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先确定的规则确定其他样本单元,这种抽样方法称为系统抽样。系统抽样的主要优点是操作简便,如果有辅助信息对总体内的单元进行有组织的排列,可以有效的提高估计的精度,缺点是对估计量方差的,估计比较困难。

例如:调查山东省居民对住房价格满意度,将16地市按某种规律进行编号,将各市分为四段,在1-4之间进行简单随机抽样,若抽到3,则编号为3,7,11,15的地级市被抽中。

抽样误差与非抽样误差

有估计就有误差,根据误差来源不同,可以分为抽样误差和非抽样误差。

抽样误差:由于抽取样本的随机性造成的样本量与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免。虽然抽样误差无法消除,但可以对其进行计量,并加以控制。控制的根本方法就是改变样本量。样本量越大,抽样误差越小。

非抽样误差:除随机性以外的其他多种原因引起的估计值与总体参数之间的差异,是需要极力避免的。

精度通常是由误差来体现的,若不考虑非抽样误差,精度的具体体现就是抽样误差。误差越小,则估计精度越高,样本量越大。

同时样本量也与调查费用有关。样本量越大,调查费用越高,呈现性关系。但样本量与精度是成非线性关系的。除样本量以外,影响精度与费用的其他因素还包括抽样方式与估计方法。因此精度与费用也是评价抽样设计方案优劣的两条准则,即精度最高,费用最少。

调查中的非抽样误差?

抽样调查中的误差包括抽样误差和非抽样误差。

抽样误差是指由于抽样的随机性,所引起的样本统计量的数值与总体目标变量真值之间的差异,它是抽样调查所特有的。抽样误差在概率抽样条件下,可以计量并通过抽样设计加以控制。

非抽样误差是指除抽样误差以外的,由于各种原因引起的误差。在概率抽样、非概率抽样、其他的全面调查和非全面调查以及普查中,非抽样误差都有可能存在。

非抽样误差的特点?

首先,非抽样误差的产生不是因为抽样的随机性,所以在抽样调查中,它不可能随着样本量的增大而变小,有时情况还有可能会相反。样本量越大,非抽样误差越大。因为调查中更多人为因素的摄入会增大非抽样误差出现的机会

其次,在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏。例如,如果非抽样误差产生于调查的无回答,而回答层和无回答层的被调查单元在目标变量方面存在差异,仅仅用回答层的观测数据对总体目标变量进行推断,就会造成有偏估计。

再次,有些非抽样误差难以识别和测定。例如,如果调查设计人员并没有意识到调查框是不完善的,因而导致所得到的调查结果包含非抽样误差,而使用数据的人员却没有意识到也不可能知道这些问题的存在。

最后,由于产生非抽样误差的渠道众多,有些非抽样误差成因复杂,尤其调查对象是人的时候,社会因素、经济因素对非抽样误差的范围和程度都将产生不可忽视的影响,而且与抽样误差相比,对非抽样误差的研究还不够深入。因此从实践角度看,非抽样误差对调查数据质量和估计结果的负面影响非常大,对此必须引起高度重视。

非抽样误差可以产生于抽样调查的各个阶段,包括调查及抽样设计阶段、数据采集阶段、数据处理与分析阶段。

调查及抽样设计阶段:调查设计包括多项工作,任何一项工作出现问题都可能造成难以补救的后果。例如,问卷设计有缺陷、抽样框不完善、调查对象的单元在抽样框中不存在等。

数据采集阶段:一方面是调查实施过程中,调查人员没有从被调查者那里得到所需要的信息。这种现象称为无回答。有时候虽然调查者做出了回答,但与真实情况或与事实不一致,信息明显失真而将其剔除,这就变成了无回答。

数据处理与分析阶段:对调查资料进行审核、整理、编码和录入过程中,出现差错所引起的误差。误差还可能产生于不正确的估计程序之中。

上述非抽样误差按其来源性质不同可以分为3类。

抽样框误差,即由于不完善的抽样框引起的误差。

无回答误差,即由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失。

计量误差,所获得的调查数据与其真值不一致造成的误差。

抽样框误差?

抽样总体的具体表现是抽样框。理想抽样框的标志是目标总体和抽样总体完全重合,也就是说目标总体单元和抽样总体单元完全成一一对应的关系,否则抽样框就是不完善的。这意味着有可能出现抽样框误差。不完善抽样框的主要问题是总体单元数N不准确,这时利用样本统计量对总体参数进行估计,就可能产生估计偏差。这种误差并不是来自于抽样的随机性,而是产生于不完善的抽样框,所以抽样框误差是一种非抽样误差。

无回答误差?

无回答误差是指在调查中处于各种原因,调查人员没能从入选样本的单元所获得所需要的信息,由于数据缺失造成估计量的偏差。这种情况一般发生在调查对象为人的时候。无回答误差是一种重要的非抽样误差,对调查数据的质量有重要影响。

从内容上看,可以分为单元无回答和项目无回答。从性质上看,可以分为有意无回答和无意无回答。当然如果无回答产生于某个群体,而该群体与其他群体在目标变量方面存在数量差异,那么即便是无意无回答也会造成估计量的偏差。

降低无回答的措施?

问卷设计具有吸引力,容易引起调查者参与的兴趣,并注意适当的长度。

在可能条件下,充分利用调查组织者的权威性和社会影响力,激发被调查者的参与意识。

确定准确的调查方位,使调查员容易找到被调查者。

采取有助于消除被调查者冷漠、担心或怀疑的措施。如:预先通知、调查前的解释说明、雇佣与被调查者熟悉的人作为调查人员等。

注意调查人员的挑选,调查人员的身份与被调查者越接近,就越容易被对方接受。

做好调查人员的培训,增强调查人员的责任心,提高访谈技术。

注意调查过程的监控,对不成功的调查及时总结,找出解决问题的办法。

奖励措施,调查总要占用被调查者的时间和精力,适当的奖励是必要的。

再次调查,再次调查是指在概率抽样第一轮调查完成后,针对无回答产生的原因采取相应的措施,对无回答单元进行再次调查。

替换被调查单元,对于放弃的无回答者需要抽取替换单元,以便使接受者数不低于设计要求。替换的原则应该事先规定,替换原则的事先规定不仅可以防止调查人员自作主张,也便于事后检查。

计量误差?

计量误差是指出于种种原因,调查中所获得的数据与其真值不一致。由于造成这种不一致的原因很多,所以计量误差涵盖内容广泛。主要原因来自于以下几个方面:

设计不周引起的误差:由设计方面的原因造成计量失真。

被调查者误差:被调查者提供的数据失真。

调查者误差:由现场调查人员造成的误差。

其他误差计量误差的产生还有其他来源。如,测量工具不精确、编码有误、录入失误等。

减少计量误差的措施?

减少计量误差可以在调查设计方面、现场准备方面、调查结果审核方面分别进行控制。

调查设计方面:调查设计的质量与调查人员的能力密切相关。调查问卷设计完成后应组织有关人员对问卷进行讨论。如果是大规模的调查活动,还应在正式调查之前进行预调查,在实践中对问卷进行检验。如果设计人员具有丰富的专业知识,又了解实际情况,由调查设计所引起的误差是可以得到有效预防。

现场准备方面:主要的准备工作包括招聘访问员、培训访问员、编写调查手册。

调查结果审核方面:审核是对调查质量进行控制的一道工序,也是减少计量误差的有效方法。审核的目的是要保证调查所得到数据的完整性、一致性和有效性。

审核可以在调查过程中的任何阶段进行。

收集数据时进行审核:收集数据时可以进行现场审核,访问员在调查进行过程中根据常识或经验可以判断出一些问题的答案是否属于可接受范围。

数据收集完毕后进行审核。通常比较全面、复杂的审核是在数据收集完毕后进行的,可以把审核视为一个独立的工作环节。在这个阶段虽然也进行数据有效性的审核,但侧重点是数据的一致性审核和离群值的检测。

  • 0
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

九九jiujiu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值