文章目录
1. hadoop集群搭建(笔记版)(易错点分析)
链接
hadoop集群搭建
相关文件下载及配置
网络配置
基础配置
编辑hosts文件
SSH免密登陆
scp、xsync集群分发脚本
修改核心配置文件
关于hadoop节点无法启动
2. Hadoop的javaAPI客户端HDFS配置使用详解
链接
环境配置
Hadoop项目maven依赖
增加日志配置文件
(1)log4j2.xml
(2)lg4j.properties
执行代码
Google Option概要及使用
3. HDFS数据存储与数据管理
1. Hadoop常用文件存储格式
2. 文件压缩格式
2.1 Hadoop支持的压缩算法
2.1.1 压缩算法比较
2.2 HDFS压缩如何抉择
3. HDFS存储类型和存储策略
原文链接:https://blog.csdn.net/weixin_44758876/article/details/122468697
4.HDFS数据迁移解决方案
1.1 数据迁移使用场景
1.2 数据迁移要素考量
1.3 HDFS分布式拷贝工具:DistCp
1.3.1 DsitCp介绍
1.3.2 DsitCp特性
1.3.3 DistCp命令
原文链接https://blog.csdn.net/weixin_44758876/article/details/122474886
5.HDFS NAMENODE 安全模式
-
HDFS NAMENODE 安全模式
自动进入时间 自动离开条件 手动进入命令 手动离开命令
原文链接:https://blog.csdn.net/weixin_44758876/article/details/122534707
6.HDFS优化方案
1.1 短路本地读取:Short Circuit Local Reads
1.2 makeHDFS Block负载平衡器:Balancer
1.3 磁盘均衡器:HDFS Disk Balancer
1.4 纠删码技术:Erasure Coding
原文链接:https://blog.csdn.net/weixin_44758876/article/details/122534774
7.配置ha高可用
https://www.jianshu.com/p/2693f9f5a70a
https://blog.csdn.net/qq_42502354/article/details/105980277