数据采集及预处理

本文详细介绍了数据采集的方法,包括数据来源、抽样方法,重点讲述了概率抽样及其应用。接着,深入探讨了市场调研过程和问卷设计,解析了问卷的多种类型及其编码方法。最后,阐述了数据预处理的四大步骤:数据清洗、数据集成、数据变换和数据规约,其中涉及到缺失值处理、异常值检测、数据冗余分析和数据标准化等关键操作。
摘要由CSDN通过智能技术生成

版权说明:内容来自互联网及书籍





一、数据采集方法

1.数据来源

一手数据:数据的直接来源。
二手数据:数据的间接来源。内部来源:比如财务报表,包括会计计算,成本资料等。外部来源:比如各类统计年鉴等,调查机构发布的数据等。




2. 抽样方法

1. 分类






按照样本抽取方式不同分为:有放回抽样,无放回抽样

2.非概率抽样


3. 概率抽样方法分类

概率抽样主要分为 简单随机抽样, 系统抽样, 分类抽样, 整群抽样, 多阶段抽样... 现实生活中绝大多数 抽样调查都采用概率抽样方法抽取样本





评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值