粗略学习大数据一个月,从LInux开始学习各种命令,了解各种文件系统的权限,学会了如何在黑窗口装逼。嘿嘿。。。
逐渐的开始接触hadoop框架,勉勉强强算是hadooop家族的半个成员,,但是也许是没有学的透彻,,个人认为。。
好像大数据本质就是数据统计概率。。
统计数学题,,已经忘记什么时候做过这样的数学题了,,大概是小学吧。。
现在的我大概只是弄过wordcount这样的简单数据统计,大部分时间还是花在了HDFS文件系统的学习,和集群分布式存储的概念上了。。
最近有些疑惑所以在网上搜了一些问题,,借此来分享一下:
大数据就是概率统计吗?
楼一:
是,也不是。
大数据包括:获取数据,分析数据,预测行为。
其中分析数据部分主要工作就是统计各种事件的概率,作为预测行为的根据。
楼二:
显然不是的,大数据是现在很热的一项研究。简单地说就是讲大量的一类数据,通过计算和筛选,得到他们统一趋近的一个规律,用来对未来将要发生的事情做一个预言。比如天气预报就是一种大数据的结果。
我觉得