海量数据, 为何总是 "海量垃圾" ?!

最新推荐文章于 2024-08-20 11:31:17 发布

u011790275

最新推荐文章于 2024-08-20 11:31:17 发布

阅读量1.1k

点赞数

文章标签：海量数据雷军谷歌

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/featuresoft/article/details/77923302

版权

2017.9.10, 深圳, Ken Fang

雷军说：我拥有海量的数据, 却不知道怎么用？每年, 花在存储海量数据的费用, 也是海量；足以使企业破产⋯
为何会如此？

当我们将所谓 “海量数据分析” 的神秘面纱给揭开时, 打破 “海量数据分析” 的神话, 就会很容易的明白, 真正的问题到底出在哪？为何谷歌能做到的, 我们却做不到？

大家都明白的 Common Sense:
做海量数据分析, 要先能建立数据模型；有了数据模型, 我们才能从 “海量” 数据中, 去提炼出 “有用” 的数据。
海量数据分析最关键、最重要的ㄧ步：将海量数据 “转换” 为有用的数据。

而数据模型建立的前提是：
@ 要能先分析出, 产生数据背后的 “用户的目的” 。例如：用户是基于什么样的社会事件？天灾？人祸？的触发, 而生成数据的。
@ 所采集到的数据, 从 “时间” 的纬度, 必需是要有 “延续性” 的。

所以⋯
@ 当我们所拥有的数据, 虽然是海量, 但, 我们却不知道, 这些数据是为何而产生的？更糟糕的是, 数据之间, 完全没办法, 经由 “时间”, 而归纳出 “人类行为的模式”。
这样的数据, 再如何的 “海量”, 也根本没法经由 “数据分析师”, 使用任何的数据分析工具, 建立出任何有效的数据模型；海量数据将永远没办法转换为有用的数据。

为什么谷歌能做得到？
因为, 谷歌有 “搜索引擎”⋯

“搜索引擎” 使得谷歌能⋯
@ 分析出产生海量数据, 其背后的用户的目的。
@ 能采集到随着 “时间” 的演进, 而持续生成的数据；人类的行为数据。

这也就是为什么：谷歌可以早ㄧ步的就能 “精准” 的预知到, 某种流行病, 接下来会在美国的那一州流行。

所以, 别再采集, 更别再存储：
“海量”、“没目的”、“没意义”、“不持续性” 的数据了⋯

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。