hadoop
文章平均质量分 76
逗比123号
这人很懒,什么都没有写
展开
-
mapreduce,自定义排序,分区,分组实现按照年份升序排序,温度降序排序
自定义类:package myhadoop;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.WritableComparable;public class KeyClass implements WritableCo原创 2017-06-28 16:11:30 · 2277 阅读 · 1 评论 -
hadoop ha配置后一个namenode不能自动failover,相当于没有配置ha
配置了hadoop ha后,namenode kill后,另一个namenode没有变为active,相当于ha配置白配了。然后看了官网的ha配置,发现是dfs.ha.fencing.methods属性的问题。 我原先是这样配置的: dfs.ha.fencing.methods sshfence dfs.ha.fencing.ssh.private-key原创 2017-08-01 21:11:24 · 871 阅读 · 0 评论 -
hadoop2.6.5 ha配置与yarn ha配置
前提:java,ssh,hosts都配置完了。 master: namenode ,1.原创 2017-08-01 20:43:01 · 1550 阅读 · 1 评论 -
mapreduce引用第三方jar包
我的mapreduce运行要查询redis的数据,但是报错了。查了资料要引用第三方的jar包。 在Job中添加第三方包。tagJob.addFileToClassPath(new Path("/third_lib/jedis-2.9.0.jar"));tagJob.addFileToClassPath(new Path("/third_lib/commons-pool2-2.2.ja原创 2017-07-14 15:32:57 · 944 阅读 · 0 评论 -
hadoop2.6完全分布式安装
192.168.0.110 master192.168.0.111 slave1192.168.0.112 slave21.配置jdk另一博客里,三台都要配。2.添加用户hadoopgroupadd hadoopuseradd -g hadoop hadooppasswd hadoopvi /etc/sudoers配置hadoop ALL=(ALL)原创 2017-06-16 22:01:28 · 388 阅读 · 0 评论 -
centos7配置hadoop伪分布式
1.停止防火墙systemctl stop firewalld.servicesystemctl disable firewalld.service2.selinux改为disablevi /etc/selinux/configSELINUX=disabled原创 2017-06-06 15:20:23 · 378 阅读 · 0 评论 -
mapreduce读取hbase值,结果输出到多个hbase表中
package hadoop;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.Cell;import org.apache.had原创 2017-06-30 16:06:05 · 1124 阅读 · 0 评论 -
mapreduce读取hbase内容,结果放到hbase中
package hadoop;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.Cell;import org.apache.had原创 2017-06-30 15:13:07 · 580 阅读 · 0 评论 -
mapreduce读取文件内容输出到hbase
package hadoop;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop原创 2017-06-30 14:48:18 · 908 阅读 · 0 评论 -
mapreduce读取hbase数据输出到文件中
package hadoop;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop原创 2017-06-30 14:18:24 · 2483 阅读 · 0 评论 -
jobcontrol
jobcontrol可以实现多个job结合起来运行。下面就是有两个job的jobcontrol,第一个job的输出是第二个job的输入。package hadoop;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import原创 2017-06-20 15:04:05 · 800 阅读 · 0 评论 -
mapreduce输出多文件出错
运行mapreduce多文件输出试报错。17/06/19 17:25:45 INFO mapreduce.Job: Task Id : attempt_1497864070486_0001_r_000000_2, Status : FAILEDError: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.protoco原创 2017-06-19 17:54:45 · 1313 阅读 · 0 评论 -
mapreduce,自定义分区,分组,排序实现join
join1.txt:1 a 2 b3 c4 djoin2.txt:1 1111 2222 3332 4443 5553 6664 7774 8884 999自定义类:package myhadoop;import java.io.DataInput;import java.io.DataOutput;import java.io.原创 2017-06-28 17:43:03 · 410 阅读 · 0 评论 -
eclipse连接hadoop 2.6 ha配置
以前都是直接在linux上运行的,昨天配置eclipse连接hadoop,可以正常连接hdfs,但是运行mapreduce的时候就一直有错误,今天终于解决了。我也不知道为什么有这么多错误,我只写我能运行的步骤。 1. 我的hadoop是2.6版本的,就下hadoop-eclipse-plugin-2.6.0.jar,然后放到eclipse插件位置,重启eclipse。原创 2017-08-16 11:32:02 · 1362 阅读 · 0 评论