hadoop
文章平均质量分 53
QiSorry
一位正在努力学习大数据的萌新,记录自己所学的知识,希望对你我都有所帮助!
展开
-
Yarn的Tool接口实现MR程序走指定的队列
文章目录前言一、创建 Maven 项目,添加依赖二、创建 WordCount 类实现 Tool 接口三、创建 WordCountDriver 类四、打包上传到集群测试前言有时我们自己编写的MR程序需要传入一些参数比如指定任务提交到哪个队列,这时就需要实现Tool接口一、创建 Maven 项目,添加依赖<dependencies> <dependency> <groupId>org.apache.hadoop</groupId&g.原创 2021-03-15 17:29:23 · 553 阅读 · 0 评论 -
增加容量调度器队列
修改 capacity-scheduler.xml[bigdata@worker-13 ~]$ vim $HADOOP_HOME/etc/hadoop/capacity-scheduler.xml增加一个名为 hive 的队列,并添加相应的配置 <property> <name>yarn.scheduler.capacity.root.queues</name> <value>default,hive</value>原创 2021-03-04 14:53:21 · 216 阅读 · 1 评论 -
Hadoop完全分布式搭建
文章目录前言一、虚拟机准备1. 可以正常上网2. ip为静态ip3. 安装必要的环境4. 关闭防火墙以及防火墙开机自启动5. 修改主机名及添加映射6. 创建用户7. 克隆另外两台虚拟机:hadoop102 hadoop103克隆 hadoop102更改 hadoop102 相关信息测试三台虚拟机是否可以相互通信二、Hadoop安装及相关配置1.引入库2.读入数据总结前言必备条件:电脑内存最好8G以上虚拟机ip为静态ip且可以 ping 通外网提示:若满足以上条件,下面案例可供参考一、虚.原创 2021-03-02 08:59:51 · 5038 阅读 · 12 评论 -
LZO创建索引支持切片操作
查看测试文件大小[bigdata@worker-13 data]$ ll -h总用量 215M-rw-rw-r--. 1 bigdata bigdata 215M 12月 13 18:54 bigtable.lzo将测试文件上传到hdfs[bigdata@worker-13 data]$ hadoop fs -put bigtable.lzo /input为测试文件创建索引[bigdata@worker-13 data]$ hadoop jar /opt/module/hadoop-3.1原创 2021-02-24 14:50:15 · 466 阅读 · 0 评论