- 博客(5)
- 收藏
- 关注
原创 Hadoop2.x完全分布式环境搭建及测试验证
Hadoop2.x完全分布式环境搭建及测试验证前置条件:[1]已制作好CentOS虚拟机模板。[2] 该模板安装好Oracle JDK,且JAVA_HOME值为/usr/java/jdk1.8.0_171-amd64/jre。准备三台虚拟机[1] 搭建完全Hadoop...
2019-07-23 23:32:12
360
原创 Hadoop2.x伪分布式环境搭建及测试验证
Hadoop2.x伪分布式环境搭建及测试验证前置条件:Linux虚拟机一台,版本为CentOS 7.4,假设IP地址为192.168.159.181,并修改如下:[1]修改/etc/hostname的内容为hadoop01说明:修改了主机名之后需要重启才...
2019-07-22 23:05:42
267
原创 Hadoop环境搭建
Hadoop的环境可以有多种方式,比如本地模式(standalone)、伪分布式、完全分布式以及HA模式。参考:[1] http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-common/SingleCluster.html[2]https://blog.csdn.net/qq_26442553/article...
2019-07-22 23:00:16
91
原创 什么是hadoop?
Hadoop简介Hadoop的诞生Hadoop是由Apache Lucene创始人Doug Cutting创建的。它起源于开源搜索引擎Apache Nutch。Nutch项目开始于2002年,是一个可以运行的网页爬取工具和搜索引擎系统,但是这个系统无法解决数十亿的搜索问题。三篇划时代论文的诞生对Hadoop的诞生起到了决定性作用。第一篇论文:GFS2003年谷歌发表了“The...
2019-07-17 23:07:13
148
原创 什么是大数据?
大数据的背景所谓大数据,就是通常所说的具有4V特征的数据:数据量大Volume、多样性Variety、价值密度低Value、处理速度快Velocity。它是信息技术发展到一定阶段的必然产物。信息化的过程同时也是数据累积的过程。大数据的爆发有它的必然性。它主要有以下几个方面的因素:首先,互联网和移动应用的兴起,让数据的产生呈现爆发式增长,数据的累积速度比以往任何时候都要快;其次,各...
2019-07-17 22:56:13
229
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人