前言
==============================================================================
大数据时代越来越多的数据,我们怎么才能从大量数据中提取有价值的数据呢,同时这么多的数据我们该如何编写有效快速的程序进行获取
一、流程介绍
==================================================================================
原始数据集如下
第一章的教学只涉及到数据的清洗和获取,所以只有Map,没有Reduce(统计的时候才需要),大致过程如图
二、创建Maven工程项目
=========================================================================================
(1)创建Maven
打开IDAD,新建一个项目,选择Maven,点击下一步
添加项目名称,点击完成