联合之大数据(一:数据起源)

数据其实是一个很常见的东西,怎么地呢?比如:有一个孩子叫小明从小学到初中再到高中这三个阶段,如果每一个阶段他的学习成绩都很好在班上甚至整个年级每次考试都能名列前茅,那么在他考大学的时候他的父母、老师、同学认为他考上重点大学的可能性就很高。这个可能性是从何而来?如果我们让一个陌生人看一眼小明没有其他的交流和资料的辅助,一个陌生人绝不会这样认为。那么他的父母、老师、同学认为他考上重点大学的可能性如此之高的依据是什么呢?其实就是对他的了解这个了解很抽象又很具体,具体在于小明有每次的考试成绩和排名数据等这些客观的资料进行主要辅助,而抽象在于个性认知和心理素质的好坏等表现。有了客观资料这一主要的辅助他父母、老师、同学认为他考上重点大学的可能性很高也就理所当然。

以上的案例中小明的每次的考试成绩和排名数据等这些客观的资料就是数据。回到互联网的发展上来看,从上个世纪八九十年代开始中国的互联网逐渐开始缓慢的发展,到了九十年代中后期发展的速度开始提高此时逐渐的有一些互联网公司已经初露矛头。我本人是在2002年左右开始瞒着父母偷着上网吧的,那时候网吧里的电脑鼠标里还有个小圆球,系统好像用的还是windows98到网吧主要玩红警。随着时代的发展互联网在2003年开始逐渐走上高速发展的道路各种网游等游戏如雨后春笋般出现,但也同时产生了少数的网瘾少年。从数据的角度我们怎么定义一个人是不是有网瘾呢?我们可以统计它在一天之内、一周之内、一月之内的上网时间和上网时长。比如一个人一天内除工作和学习的需要其他时间上网的时长达到8小时以上,一周之内达到60个小时以上。一个月之内达到200个小时以上那么我们就可以判断出这个人有很大的网瘾(以上的时间只是假设时间,不是医学断定时间)。假如用户一直在同一台电脑上上网,那么这一天的上网时长、一周上网的时长、一个月上网的时长去那统计呢,我们可以生成用户的记录从记录中统计。

通过上面的两个举例,我们可以看出或者得出一个简单的小结:数据是从日常的生产生活中随着时间的推移而不断的增加和累积的,时间越久行为越活跃数据的积累就越多。

那么要这么多的数据干什么呢?

这就是数据的起源和数据的简单作用。下一节继续说数据的产生。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值