断断续续看了一周,这本书看完了,写的不错,例子很丰富,理解起来没有那么有难度。如果问这本书给我带来了啥,更多的是思维方式上的变化。
作者不怎么熟悉,但是译者比较了解。周涛,电子科技大学教授、博士生导师,27岁就当上教授了,百分点科技首席科学家。百分点是干啥的?是做第三方个性化推荐的,他不仅关注与研究,还关注将研究应用于商业化实践。在10年还在淘宝实习的时候,参加了一次在杭州举行的数据交流大会,有幸听了他关于个性化推荐的演讲,当时觉得这个人说话听利索的,别的没啥了。
引用周涛的几句总结,这本书好在三个方面,一是观点掷地有声,绝非主流媒体上面的简单拷贝;二是观念高屋建瓴,三是例子丰富。给读者带来的是实实在在的知识和思考,也并不是说教一派。下面把书中的结论性语言和例子摘录出来。
----------------------------------------------------------------------------------------------
“一旦思维方式转变了,数据就能够被巧妙的激发新产品和新型服务。”
“随机采样然后进行分析,在过去是主心骨,但是现在我们有了更多的数据。这时候,我们需要利用所有的数据,而不再仅仅依靠一小部分数据。”
“大数据通常用概率来说话,而不是确凿无疑的结论,当我们试图扩大数据的规模的时候,要学会拥抱混乱。”
“当收集、存储和分析数据的成本比较高的时候,应该适当的丢弃一些数据。”
“错误并不是大数据固有的特性,而是一个需要我们处理的现实问题,并且会长期存在。”
“通过探求是什么,而不是为什么,相关关系帮助我们更好的理解这个世界。”
“不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供更多的深刻洞见。”
“位置、沟通、时间、不规则文本够可以被量化为数据,世间万物都可以数据化。”
”一旦世界被数据化。拥有数据分析工具和必要的设备,我们可以在更多的领域进行更快、更大规模的数据处理了。“
”数据的基本用途是为信息的收集和处理提供了依据,但是数据背身含有潜在价值。“
”数据的真是价值就想浮在海洋中的冰山,第一眼只能看到冰山一角,而超大的价值隐藏的表面之下。“
”数据再利用,让数据的价值更大一点。“
”数据的总和比部分数据更有价值,这边是数据的重组。“
”数据具有折旧性,及时数据用户基本用途的价值会减少,但是潜在价值却依然很大。“
”数据废气,这个可能成为公司的巨大竞争优势,也可能成为对手强大进入的壁垒。“
”数据的价值在于他的使用,而不是占有本身。“
”大数据思维,是指一种意识,公开的数据一旦处理得当就能为成百千万人急需解决的问题提供答案。“
”大数据时代,很多数据在手机的时候并无意用作其他用途,而最终却产生了很多创新性的用途。“
”卓越的才华并不依赖于数据。“
”只要的得到了合理的利用,而不是单纯的只是为了数据而数据,大数据就会变成更加强大的武器。“
”公司可以利用数据的时间更长,但相应的必须为其行为承担责任以及负有特定时间之后删除个人数据的义务。“
”大数据为我们提供的不是最终答案,只是参考答案,帮助只是暂时的,而最好的方法和答案在不久的未来。“
"我们之所以能做这些事情,新工具只是一个很小的因素,无论是更快的处理器,更大的存储空间,更好的算法,这一切是因为我们拥有了更多的数据。"
”有效的利用大数据,需要专业技术和丰富的想象力,一个能够容纳大数据的心态,但价值的核心归功于数据本身。“
”我们能够处理的数据只是时间上极其微小的一部分,这些信息只不过是现实的投影。“
----------------------------------------------------------------------------------------------
例子1:在09年流感爆发的时候,google通过对人们输入词条的分析,挖掘出了有效及时的指示标,比通过层层收集的官方数据惊人很多。
例子2:Farecast通过对于机票数据的趋势变化情况,提供票价预测的服务,目前公布准确度高达75%,现在被微软收购,整合在了bing的搜索中。
例子3:Xoom是从事跨境汇款业务的公司,处理过的一个案例是,单独看一笔交易是合法的,但是重新检查了所有的数据之后,发现犯罪集团正在进行咋骗。
例子4:hadoop分析VISA的数据,将原来需要一个月的时间缩短为13分钟。
例子5:亚马逊三分之一的销售额来自个性化推荐系统。
例子6:美国折扣零售商能够通过用户购买商品的历史,判断出是否怀孕。
例子7:UPS有6W辆车,通过对车俩损害的数据挖掘,能够及时的预测那些车辆需要维修,达到预警的目的。
例子8:日本通过研究驾驶员的坐姿数据,用来作为汽车防盗系统中。
例子9:UPS通过对于位置数据的分析,获取最佳行车路径。
例子10:IBM开发了一套复杂的预测模型,完成了电动汽车动力与电力供应系统的预测。
例子11:微软和谷歌以及百度等搜索引擎的拼写检查以及纠错提示,有效的利用的数据废气。
例子12:巴诺通过分析人们在阅读的时候的行为,得出人们往往会放弃长篇幅的非小说类书籍。
例子13:The-numbers通过对于历史电影相关的数据的相关关系,来预测电影票房。