大数据
文章平均质量分 67
半斤米粉闯天下
这个作者很懒,什么都没留下…
展开
-
Hive分区操作及遇到的问题
添加分区 alter table user_bhv add if not exists partition (month="2020-03");删除分区 alter table user_bhv drop partition (month='2020-03');修复分区 msck repair table user_bhv;查看所有分区 show partitions user_bhv;查...原创 2020-03-05 15:58:21 · 2898 阅读 · 0 评论 -
HBase Unable to load native-hadoop library for your platform警告解决方案
在启动hbase shell时出现了这样的警告:2020-03-02 18:46:49,380 WARN [main] util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable其实这个警告并不影响执行命令...原创 2020-03-02 21:19:41 · 6360 阅读 · 3 评论 -
hadoop 3.2.1 Yarn集群HA搭建及踩坑记录
接上篇,hdfs集群启动后仅仅是一个分布式文件系统而已,并不具备计算的能力,因此引出yarn,记录一下yarn HA的搭建过程。首先需要注意一点,Yarn与HDFS属于两个不同的集群,一个负责文件存储,一个负责作业调度,二者之间没有必然关系,也不一定说Yarn的某些节点必须必须要放在datanaode上。通常会把nodemanager和datanode放在一起是因为要“计算向数据移动”,尽可能...原创 2020-02-27 18:55:27 · 3269 阅读 · 2 评论 -
hadoop 3.x常用端口
分类应用端口namenoderpc-address8020namenodehttp-address9870namenodehttps-address9871datanodeaddress9866datanodehttp-address9864datanodehttps-address9865原创 2020-02-20 22:05:54 · 2823 阅读 · 0 评论 -
flume与hdfs集成排雷指南
先说一下环境,flume 1.9.0,hadoop 3.2.1,兼容没有问题,官方文档没什么好说的,足够详细,每一项后面都附带有例子,好评。但是在配置sink to hdfs的时候足足趟了不少雷,记录下来希望可以帮到更多的人。错误最常见的还是java.lang.NoClassDefFoundError异常,出现这个提示100%是因为flume缺少相应的组件包,下面分别说一下缺少的内容,找到对应...原创 2020-02-20 21:50:46 · 1415 阅读 · 2 评论 -
hadoop 3.2.1集群高可用(HA)搭建
规划共三台机器,目标是搭建一套配置了HA的双副本hadoop集群,关于zkfc,journalnode的详细原理不再赘述,集群详细规划如下:namenodedatanodejournalnodeZKFCmaster***slave1****slave1***出于简单方便,我个人并没有使用zookeeper集群,而是在docke...原创 2020-02-19 23:16:54 · 3650 阅读 · 1 评论