近几年,大数据俨然成为互联网世界的宠儿。不只是出现在企业的战略中,也开始出现在政府的规划之内。据《大数据人才报告》显示,目前全国的大数据人才仅46万,未来3-5年内大数据人才的缺口将高达150万,那么作为一名大数据新手,真的已经了解大数据了吗?
大数据
一、大数据是什么?
总的来说大数据是海量的数据,大数据处理无捷径,对分析处理技术提出了更高的要求。大数据的应用遍及各个领域,而且随着时间的推移会积累的越来越多。例如最近互联网厂商“大数据杀熟”的事件:有网友发现,同一段路程,打车软件对两部手机的报价却不一样,详细见下图。
大数据领域
应该说这是个反面教材,但是我们举一反三,不论是什么行业各个领域,各个公司都需要利用自己所拥有的用户数据,对老用户进行分析,进而产生用户需求及特点来进行软件开发以及完善产品。
二、大数据就业以及薪资
根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。
大数据人才招聘
大数据主要的三大就业方向:大数据系统研发类人才、大数据应用开发类人才和大数据分析类人才。在此三大方向中,各自的基础岗位一般为大数据系统研发工程师、大数据应用开发工程师和数据分析师。
大数据是一个宽泛的主题,因此所需要学习的内容涵盖多方面的知识。想要从事该领域工作的人们需要具备一系列的特定技能。
三、大数据处理技术
以最常使用的Hadoop为例:Hadoop是Apache公司开发的一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。
Hadoop类似于一个数据生态圈,不同的模块各司其职。下图是Hadoop官网的生态图。
Hadoop生态图
Hadoop的LOGO是一只灵活的大象。关于LOGO的来源,网上众说纷纭,有人说,是因为大象象征庞然大物,指代大数据,Hadoop让大数据变得灵活。而官方盖章,LOGO来源于创始人Doug Cutting的孩子曾为一个大象玩具取名hadoop。
从上图也可以看出,Hadoop的核心是HDFS,YARN和MapReduce,这几个主要模块的含义和功能都是什么呢?