自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

海恋北斗星

严于律己,宽以待人。

  • 博客(6)
  • 资源 (6)
  • 收藏
  • 关注

原创 大数据-HDFS(五)

大数据-HDFS(七)DataNode工作机制以及数据存储DataNode工作机制1)一个数据块在datanode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2)DataNode启动后向namenode注册,通过后,周期性(1小时)的向n...

2020-02-18 10:20:47 283

原创 大数据-HDFS(四)

大数据-HDFS(六)NameNode与SecondaryNameNode解析NameNode 主要负责集群当中的元数据信息管理,而且元数据信息需要经常被随机访问,所以元数据信息必须支持快速检索,那么如何保证 NameNode 快速检索呢?元数据信息保存在哪里能够快速检索呢?又如何保证元数据的持久安全呢?为了保证元...

2020-02-16 18:08:47 316

原创 大数据-HDFS(三)

大数据-HDFS(四)hdfs的架构以及block块和副本机制hdfs分布式文件系统是一个主从架构,主节点是NameNode,负责管理整个集群以及维护集群的元数据信息;从节点是DataNode,主要负责文件数据存储。hdfs将所有的文件全部抽象成为 block 块来进行存储,不管文件大小,全部一视同仁都是以bl...

2020-02-14 10:51:19 217

原创 大数据-HDFS(二)

大数据-HDFS(三)HDFS 的 java API 开发第一步:配置Windows的 hadoop 环境变量1、解压资料当中的 hadoop-2.6.0-cdh5.14.2_windows环境配置安装包.rar 这个压缩文件文件到一个没有中文没有空格的目录下2、然后在windows当中配置hadoop...

2020-02-14 10:03:43 376

原创 大数据-HDFS(一)

大数据-HDFS(一)Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的...

2020-02-12 15:41:14 649

原创 大数据-基础环境搭建

大数据-基础环境搭建(一)服务器设置 本文使用三台Linux服务器做统一环境。三台机器的IP设置修改三台服务的ip地址vi /etc/sysconfig/network-scripts/ifcfg-ens33BOOTPROTO="static"IPADDR=192.168.52.100...

2020-02-10 15:05:06 932

Spark调优 Spark应用程序性能优化

分配更多的资源是性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的,基本上,在一定范围之内,增加资源与性能的提升,是成正比的;写完了一个复杂的spark作业之后,进行性能调优的时候,首先第一步,就是要来调节最优的资源配置;在这个基础之上,如果说你的spark作业,能够分配的资源达到了你的能力范围的顶端之后,无法再分配更多的资源了,公司资源有限;那么才是考虑去做后面的这些性能调优的点。

2020-09-21

scala语言知识点.xmind

scala是运行在 JVM 上的多范式编程语言,同时支持面向对象和面向函数编程;早期scala刚出现的时候,并没有怎么引起重视,随着Spark和Kafka这样基于scala的大数据框架的兴起,scala逐步进入大数据开发者的眼帘。scala的主要优势是它的表达性。

2020-05-13

HDFS读写流程.xmind

HDFS读写数据流程描述,脑图展示,易于理解与记忆,仅供学习使用。HDFS分布式文件系统是一个主从架构,主节点是NameNode,负责管理整个集群以及维护集群的元数据信息;从节点是DataNode,主要负责文件数据存储。

2020-04-03

HDFS.xmind

HDFS基础概念描述,脑图展示,易于理解与记忆,仅供学习使用。Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。

2020-04-03

MapRrduce代码实例

MapRrduce代码实例 实现了单词计数 和 流量统计功能,自定义Mapper 和 Reduce类,完成了MapReduce的核心功能。

2020-03-03

hdfs java代码实现文件基础操作

hdfs代码实例 通过Java代码在HDFS上创建目录、上传文件、下载文件、删除文件、文件重命名、文件列表等操作。

2020-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除