Hadoop
文章平均质量分 57
for your wish
好记性不如烂笔头。个人笔记用的博客
展开
-
猛犸优化Summary
同层次的任务最多默认只能启动10个,十个席位空闲出来才能有新的任务执行。原创 2022-11-23 14:23:55 · 300 阅读 · 0 评论 -
Hadoop的log4j审计日志文件
自定义修改hadoop/conf/log4j.properties hdfs审计日志(Auditlog)记录了用户针对hdfs的所有操作,详细信息包括操作成功与否、用户名称、客户机地址、操作命令、操作的目录等。对于用户的每一个操作,namenode都会将这些信息以key-value对的形式组织成固定格式的一条日志,然后记录到audit.log文件中。通过审计日志,我们可以实时查看hdfs的各种操作状况、可以追踪各种误操作、可以做一些指标监控等等。 hdfs的审计日......转载 2021-08-05 14:04:46 · 1510 阅读 · 0 评论 -
监控FLINK ON YARN运行错误日志并发送钉钉告警
文章目录1.创建shell监控脚本flink_log_monitor.sh 2.设置钉钉智能机器人 3.crontab执行脚本 4.mysql存放日志INFO 5.钉钉告警1.创建SHELL监控脚本FLINK_LOG_MONITOR.SH #!/bin/bashnow=`date '+%Y-%m-%d %H:%M:%S'`# 传入要遍历的目录root_dir="$1"# 初始化监控文件,通过getdir方法得到monitor_file=# 错误记录到mysq.转载 2021-06-08 10:09:40 · 1195 阅读 · 0 评论 -
合并hdfs小文件
如果需要合并HDFS上的某个temp目录下有很多小文件(1.txt,2.txt),可以尝试使用下面的命令: hadoop fs -cat hdfs://cdh5/tmp/*.txt | hadoop fs -appendToFile - hdfs://cdh5/tmp/hdfs_largefile.txt注意:这种处理方法在数据量非常大的情况下可能不太适合,最好使用MapReduce来合并。...原创 2020-11-24 09:43:52 · 614 阅读 · 0 评论 -
将hdfs文件加载入hive表
1.第一种方法当存储路径与表所在路径不一致时,可以load进去,如果表中字段类型不对应,该字段的值将会为空load data inpath 'hdfs://hadoop01:9000/tmp/sales_info.txt' overwrite into table sales_info partition(dt = '20191215');2.当存储路径与表所在路径一致时,可以采用添加分区的方式alter table ods_nshop.ods_01_releasedatas add p..原创 2020-10-10 13:06:58 · 1793 阅读 · 1 评论 -
Hdfs文件操作问题
hadoop HDFS常用文件操作命令命令基本格式: hadoop fs-cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件 hadoop fs-ls/dir hadoop fs-ls-R/dir--列出hdfs文件系统所有的目录和文件 2.puthadoop fs -put <...原创 2020-10-10 10:47:28 · 370 阅读 · 0 评论 -
Hdfs操作问题
HDFS客户端权限拒绝:Permission denied 执行这样的操作 hadoop fs -chmod 777 /user/hadoop sudo-uhdfshadoopfs-mkdir/newFile原创 2019-05-30 15:28:42 · 254 阅读 · 0 评论 -
安装Hadoop生态组件
简介:这篇文章介绍,安装Centos6.9环境下的Zookeeper,Mysql,Kafka,Canal,Flume,Hadoop,Hive,Sqoop,Hbase,Spark(后续会增加ELK,Ozzie,Azkban)新建虚拟机-->典型-->Linux,Centos64-->名字,路径-->一路默认-->完成 -->自定义高级--&...原创 2019-02-26 10:29:39 · 386 阅读 · 0 评论 -
Centos6.9环境下编译Hadoop2.7.4源码包
官网下载source包hadoop-2.7.4-src.tar.gz一,准备的资料源码根目录下有个BUILDINT.txt,打开即可看见里面关于编译hadoop的一些环境要求 64位linux系统CentOS 6.9。JDK 1.7+。maven-3.2.5。 一个项目管理综合工具, 使用标准的目录结构和默认构建生命周期protobuf 2.5.0 google的一种数据交换的...原创 2019-01-31 16:34:52 · 235 阅读 · 0 评论