自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 并行计算框架Mapreduce简介

hadoop的三个组件,先有mapreduce(分布式计算模型),后有hdfs,知道hadoop才有了yarn,因此掌握mapreduce很有必要,虽然现在都是使用流式处理框架,如storm,spark等,但是这几种框架的思想及原理都来源于mapreduceMapreduce:          思想:分而治之:map(映射)--->对每一部分的数据进行处理,可以高度并行(最核心的部...

2018-05-31 13:18:15 2701

原创 yarn对集群资源的管理和调度

*资源调度和资源隔离是yarn作为一个资源管理系统,最重要和最基础的两个功能,资源调度是由ResourceManager完成的,资源隔离是由各个NodeManager实现的*ResourceManager将某个NodeManager上资源分配给任务(这就是所谓的"资源调度")后,NodeManager需按照要求为任务提供相应的资源,甚至保证这些资源应具有独占性,为任务运行提供基础的保证,这就是...

2018-05-29 14:42:08 1064

原创 YARN的架构组件功能

hadoop1.0和hadoop2.0的最大区别就在于hadoop2.0多出了一个yarn,hadoop1.0中Mapreduce即承担集群资源的管理和调  度,又承担数据的处理,而hadoop2.0中将这两个任务分离开,yarn来对集群的资源进行管理和调度,Mapreduce来进行数据的处理,并且Mapreduce是运行在yarn上边的,yarn上不仅能运行Mapreduce这种并行计算框架,还...

2018-05-29 14:07:51 1097

原创 HDFS启动时的safemode模式

安全模式safemode整个过程是从启动datanode到启动完毕   safemode的作用:          *等待datanode向namenode发送块的报告          *namenode会将块的个数和fsimage和edits中的作比较,当达到99.999%的阈值时安全模式safemode会自行在30秒后                退出,这30秒的缓冲时间是为了...

2018-05-28 15:50:16 1533

原创 NameNode启动过程以及SecondaryNameNode辅助功能

NameNode存储的是整个文件系统的元数据,存放在两个地方:    *内存    *本地磁盘:      fsimage镜像文件        edits编辑日志文件第一次启动hdfs时会进行格式化操作,目的就是为了生成fsimage镜像文件,用来存储整个文件系统的元数据以下是整个流程:第一次启动: 1)进行hdfs的格式化操作 2)生成fsimage镜像文件 3...

2018-05-28 09:44:38 1553

原创 hadoop集群部署

hadoop集群部署分为三种:本地部署     伪分布式部署      分布式部署分布式部署顾名思义前提要有至少多台服务器,所以这里只介绍前两种部署方式,但是本地部署非常简单,只有几步,按照官方文档完全可以进行,所以下面主要讲伪分布式部署方式伪分布式:1.准备工作:在linux环境下安装jdk和hadoop,上传压缩包----》解压----》检验是否安装成功2.在core-...

2018-05-25 21:16:47 1953 2

原创 Linux基本命令(VM中的ubuntu)

1.创建用户,用户间切换 #表示是root用户                $表示是普通用户创建用户: useradd  用户名创建密码:passwd   用户名切换用户: su 用户名2.主机名与ip1)修改主机名:hostname 主机名(暂时修改)   永久修改:使用命令  vi  etc/hostname    将里面的原主机名修改为你想要的主机名,然后重...

2018-05-20 18:56:28 1210

原创 VM虚拟机中如何设置ip地址

当我们在windows环境下,在cmd命令行中输入ipconfig可以看到我们的主机ip地址,但是我们创建了一台虚拟机,并且装好系统时,输入ifconfig(这里和windows下命令不一样,不要搞混了)时,会发现得不到ip地址,下面就说一下如何设置虚拟机的ip首先我们找到VM软件的顶部:虚拟机---》设置,然后在设置里面修改网络适配器为NET模式这个时候应该就可以连上网络并得到ip地...

2018-05-14 20:26:11 104554 5

原创 equals和==的区别

==用来判断两个变量的值是否相等,变量分为基本数据类型变量和引用类型变量,基本数据类型变量直接比较两个变量的值,引用数据类型变量要比较引用类型的内存的地址  equals用来比较两个对象,Object类中的equals方法是比较两个对象的地址,而对于String、Date、Integer之类的equals方法已经被重写了,比较时是看两个值是否相等,对于没有重写equals方法的对象,如...

2018-05-05 15:46:09 240 1

原创 java中基本数据类型

8种基本数据类型:4种整数类型:int   short    long    byte2种浮点数类型:float    double1种字符类型:char1种布尔类型:boolean基本数据类型                       大小(二进制)                          字节(bit)数               默认值   int   ...

2018-05-04 16:14:22 203

原创 使用cmd命令行实现百度云不限速下载

需要准备工具:Windows10,CMD命令行,BaiduPCS-GO插件。下载完毕后可以存放到任何位置,建议存放到无中文目录内。然后打开我的电脑-属性-高级系统设置-环境变量-系统变量-Path。点击编辑,新建,输入你的BaiduPCS-Go存放目录,看清楚是存放目录▼如图所示:(我的存放目录是D:\BaiduPCS-Go)这样CMD才可以正确识别到程序做好所有准备后,Win+R键运行CMD,输...

2018-05-04 15:52:31 7122 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除