- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 git和github
一、git简介 git(读音为/gɪt/。)是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。 二、配置git 1.安装git [root@foundation66 ~]# yum install git [root@foundation66 ~...
2018-12-12 18:47:35 147
原创 Hadoop2.7.3 HA高可靠性集群搭建(Hadoop+Zookeeper)
一.概述 在hadoop1时代,只有一个NameNode。如果该NameNode数据丢失或者不能工作,那么整个集群就不能恢复了。这是hadoop1中的单点问题,也是hadoop1不可靠的表现。 在典型的 HA 集群中,通常有两台不同的机器充当 NN。在任何时间,只有一台机器处于Active 状态;另一台机器是处于 Standby 状态。Active NN 负责集群中所有客...
2018-12-07 21:12:06 687
原创 hadoop完全分布式集群部署
实验环境: 172.25.66.1 namenode节点(上一篇博客已部署成功) 172.25.66.2 datanode 节点 172.25.66.3 datanode节点 server1: 1.停掉之前的hdfs和yarn集群 2.安装nfs服务,进行文件共享 [root@server1 ~]# yum install -y nfs-utils [root@server1 ...
2018-12-04 22:20:18 146
原创 hadoop伪分布式部署
hadoop部署 1.创建hadoop用户并为其设置密码 2切换到hadoop用户安装java环境 3.安装hadoop 4.独立操作debug [hadoop@server1 etc]$ cd .. [hadoop@server1 hadoop]$ pwd /home/hadoop/hadoop [hadoop@server1 hadoop]$ mkdir...
2018-12-04 17:00:42 540
原创 hadoop简介
大数据和hadoop的关系: 随着近几年计算机技术和互联网的发展,“大数据”这个名词越来越多进入我们的视野。大数据的快速发展也在无时无刻影响着我们的生活。 那大数据究竟是什么呢? 首先,看看专家是怎么解释大数据的: 大数据就是多,就是多。原来的设备存不下、算不动。 ——啪菠萝·毕加索 大数据,不是随机样本,而是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。—— Schön...
2018-12-03 22:01:48 478
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人