《大数据时代》第一章

统计采样:

1.采样分析的精确性随着采样随机性的增大而大幅提高,但与样本数量的增加关系不大。样本选择的随机性比样本数量更重要。

2.如果抽样的对象变得复杂,例如是一个网络,那根本就找不到“最优抽样的标准”,更不可能要求得到的小网络能够反映总体的所有结构特性。

3.随即抽样不适合考察子类别的情况,一旦继续细分,随机采样结果的错误率会大大增加。

4.通过随机采样得出的调查结果不具有延展性,只能实现计划内目的。

5.采样的目的就是用最少的数据得到最多的信息。但当人们可以获得并处理海量数据时,它就没什么意义了。


大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。这里的“大”是相对意义而不是绝对意义,也就是说这是相对于所有数据来说的。


本文只是对书中一些内容做了摘抄以备后用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值