大数据?别唬人了

大数据可能是现在最炙手可热的技术名词了。热就意味着有泡沫,有值得反思的地方。Quartz的Christopher Mims 5月6日发表了一篇文章,名为“大多数数据都不大,假装大数据其实是瞎浪费钱”,有理有据,推荐一读: http://qz.com/81661/most-data-isnt-big-and-businesses-are-wasting-money-pretending-it-is/

文中主要指出的观点如下:
1. 一般企业根本用不着大数据
即使是Facebook和Yahoo这样的互联网巨头,大多数任务也用不着大数据。Facebook大部分任务是MB到GB范围,Yahoo集群所处理的任务数据中位数也只有12.5GB。难怪微软今年2月曾经发表过一份技术报告( http://research.microsoft.com/pubs/179615/msrtr-2013-2.pdf ),大致的结论是,其实大部分类型的任务scale-up的方案更有优势。

2. 很多人说的大数据其实是数据分析的同义词,完全是在添乱
许多讲大数据的文章,许多例子用Excel、Google Docs就能搞定。当然,正如Rufus Pollock指出的,其实小数据才是真正的革命。( http://blog.okfn.org/2013/04/22/forget-big-data-small-data-is-the-real-revolution/

3. 数据并不是越多肯定越好,很可能最后反而事倍功半,投入很多,所获稀少。有些情况下,数据多产生的结果反而让你不知所措。

结论:数据多少不那么重要,重要的是收集正确的数据,数据质量、清晰的目标、上下文和直觉可能更重要。

HN上的讨论有很多干货: https://news.ycombinator.com/item?id=5696451
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值