需求:
背景描述
近年来随着IT产业的加速发展,全国各地对IT 类的人才需求也越来越多,
“XHS 集团”为了明确公司在各区域的发展布局,在多个省份进行IT公司岗位
情况调研分析。你所在的小组将承担模拟调研分析的任务,通过在招聘网站进
行招聘信息的爬取,获取到公司名称、工作地点、岗位名称、招聘要求、招聘
人数等信息,并通过数据的清洗和分析,最终分析出各地区热门岗位招聘人数,
各地区平均薪资的差异。
本次为模拟任务,项目组计划使用分布式节点Hadoop模式,环境搭建采用
服务器集群方式,通过在招聘网站上爬取到的相关信息,实现对数据进行爬取、
清洗、整理、计算、表达、分析,力求实现对各城市IT行业拥有更清晰的掌握。
作为该项目组的技术人员,你们是这次技术方案展示的核心成员,请按照
下面步骤完成本次技术展示任务,并提交技术报告,祝你们成功。
任务一: Hadoop 平台及组件的部署管理( 15 分)
1) 将指定路径下的Hbase 安装包解压指定路径下;
2) 把解压后的 apache-Hbase-2.0.1-bin 文件夹更名为 Hbase;进入 Hbase 文件
夹;
3) 设置Hbase 环境变量,并使环境变量只对当前root 用户生效;
4) 修改Hbase 安装目录下hbase-site.xml;
5) 修改Hbase 安装目录下hbase-env.sh;
6) 修改Hbase 安装目录下regionservers;
7