大数据
fancyfreeman
这个作者很懒,什么都没留下…
展开
-
《大数据时代》摘抄,引言部分
最近读了《大数据时代》这本书,觉得写得非常好,读了一遍意犹未尽,于是回过头来再看一遍,把一些精华摘抄出来。引言—— 一场生活、工作与思维的大变革谷歌的冬季流感预测系统:关注特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。大数据导致新的处理技术的诞生:mapReduce、Had原创 2013-02-25 14:48:00 · 4545 阅读 · 0 评论 -
《大数据时代》摘抄,第一部分大数据时代的思维变革(1、不是随机样本,而是全体数据)
大数据强调更多的数据,不是随机样本,而是全体数据让数据“发声”——IBM的资深“大数据”专家 Jeff Jonas提出要让数据“说话”。 注:数据如何才能说话呢?数据是客观的,我想数据的要表达的意思是它在的数学与统计上呈现的特征,以及根据这些特征所获得的洞察,如何能理解数据呢?数学和统计是它的语言。目前我们可以处理的数据量已经大大增加,而且未来会越来越多。在某些方面,我们依然没有完全意识原创 2013-02-25 16:22:36 · 6195 阅读 · 0 评论 -
《大数据时代》摘抄,第一部分大数据时代的思维变革(2、不是精确性,而是混杂性)
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。允许不精确——数据量的大幅增加会造成结果的不准确,与此同时,一些错误的数据也会混进数据库。然而,重点是我们通过努力避免这些问题,学会接受它们。混杂性一方面来自错误的数据(测量的不准确),也来自格式原创 2013-03-01 13:39:08 · 5991 阅读 · 0 评论