大数据技术原理与应用作业一
1.试述信息技术发展史上的3次信息化浪潮及其具体内容。
第一次信息化浪潮发生在1980年前后,具体标志是个人计算机的出现,PC开始普及,使得计算机走入企业和千家万户,大大提高了社会生产力,个人计算机的出险,解决了信息处理的问题;随后在1995年前后,随着第二次信息化浪潮人类全面进入互联网时代,就是在这个时期缔造了Yahoo,Google,Alibaba,Baidu,Tencent等互联网巨头。互联网的出现解决了信息传输的问题;在2010年前后,云计算、大数据物联网的快速发展,拉开了第三次信息化浪潮的大幕,大数据时代已经到来。大数据时代的来临,也意味着信息爆炸的问题的解决。
2.试述数据产生方式经历的几个阶段。
数据,就是我们通过观、实验或计算得出的结果。数据产生方式的变革,是促成大数据时代来临的重要因素。总体而言,人类社会的数据产生方式大致经历了3个阶段:运营式系统阶段、用户原创内容阶段和感知式系统阶段:
运营式系统阶段:
数据库的出现使数据管理的复杂度大大降低,数据往往伴随这一定的运营活动而产生并记录在数据库中,数据的产生方式是被动的
用户原创内容阶段:
数据爆发产生于web2.0时代,而web2.0的最重要标志就是用户原创内容。
智能手机等移动设备加速内容产生
数据产生方式是主动的
感知式系统阶段
感知式系统的广泛使用
人类社会数据量第三次大的飞跃最终导致了大数据的产生
1)运营式系统阶段
人类社会最早大规模管理和使用数据,是从数据库的诞生开始的。数据库中保存了大量结构化的企业关键信息,用来满足企业各种业务需求。在这个阶 段,数据的产生方式是被动的,只有当实际企业业务发生时,才会产生新的记录并存入数据库。
2)用户原创内容阶段
互联网的出现,使得数据传播更加快捷,不需要借助于磁盘、磁带等物理介质传播数据,网页的出现进一步加速了大量网络内容的产生,从而使得人类社 会数据量开始呈现“井喷式”增长。但是,互联网真正的数据爆发产生于以“用户原创内容”为特征的Web2.0时代。Web2.0强调自服务,大量上网用户本身就是 内容的生成者,数据量开始急剧增加。
3)感知式系统阶段
物联网的发展最终导致了人类社会数据量的第三次跃升。物联网的一些传感设备,每时每刻都在产生大量数据,与Web2.0时代的人工书产生方式相比, 物联网中的自动数据产生方式,将在短时间内生成更密集、更大量的数据,使得人类社会迅速步入“大数据时代”。
3.试述大数据的4个基本特征。
大数据的4个特点,包含4个层面:数据量大(Volume)、数据类型繁多(Variety)、处理速度快(Velocity)和价值密度低(Value)。
1)数据量大
人类进入信息社会以后,数据以自然方式增长,其产生不以人的意志为转移。随着物联网和Web2.0移动互联网的快速发展,各种数据产生速度之快,产 生数量之大,与i经远远超出人类可以控制的范围。