大数据
古巴与八股
未来的相视一笑 只因曾经的全然相爱
展开
-
mapreduce作业接受序列化文件(SequenceFile)作为文件输入的WordCount程序
MapReduce作业接受序列化文件的输入时,可通过配置job的输入文件格式实现,具体见代码:package hadoop;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apach原创 2017-09-25 22:38:01 · 432 阅读 · 0 评论 -
hadoop生成序列化文件(SequenceFile)的程序
package hadoop;import java.io.IOException;import java.net.URI;import java.nio.file.Path;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.had原创 2017-10-10 23:18:45 · 929 阅读 · 0 评论 -
storm在用命令提交任务时,在work的日志里出现 找不到类 的错误
storm在用命令提交任务时,在work的日志里出现 找不到类 的错误,具体报错如下所示:2017-12-10T15:55:42.615+0800 b.s.m.loader [INFO] Starting receive-thread: [stormId: Clustertopology-1-1512892537, port: 6700, thread-id: 0 ]2017-12-10T1原创 2017-12-10 18:30:28 · 1528 阅读 · 1 评论 -
利用 HBase 模拟微博的实例
操作HBase数据库的类:package mblog;import java.io.IOException;import java.util.ArrayList;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.Cell;import org.apache.hadoop.hbase原创 2017-10-10 23:01:56 · 2613 阅读 · 0 评论 -
hbase使用外部(非自带)zookeeper搭建伪分布式环境
1、修改conf/hbase-env.sh中的HBASE_MANAGES_ZK为false:export HBASE_MANAGES_ZK=false2、修改conf/hbase-site.xml如下所示: hbase.rootdir file:///home/hbase-0.98.6-hadoop1/data原创 2017-12-15 21:22:41 · 7070 阅读 · 0 评论 -
hadoop 二次排序 group函数的作用的说明
hadoop mapreduce作业通过组合key实现二次排序的过程中,只要实现组合key的类就可以了。mapreduce框架本身会基于key对输出进行排序。而partion函数只为了是实现数据规模较大时,对map的输出实现分区。为启动多个reduce任务做准备。group函数也是可有可无的。group函数的作用是对key进行分组,例如对于map的结果:[(k1, k21), v1原创 2017-10-10 20:55:19 · 651 阅读 · 0 评论 -
Spark实现之 好友推荐
网上好多好推荐之类的博客都是基于二度好友的推荐,下面介绍基于邻接表的好友推荐的spark实现。输入: 1 2,3,4,5,6,7,8 2 1,3,4,5,7 3 1,2 4 1,2,6 5 1,2 6 1,4 7 1,2 8 1 第一列表示用户,后面的表示用户的所有好友。需求:找出用户好友的好友原创 2018-01-07 23:12:29 · 2750 阅读 · 0 评论 -
HBase单节点的配置
HBase单节点模式需配置三个文件1、配置hbase-env.sh a)修改 export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 b)修改 export HBASE_MANAGES_ZK=false 默认为true,意思是使用自带的zooKeeper2、配置hb原创 2017-09-23 13:18:52 · 705 阅读 · 0 评论 -
Idea 打包jar文件,可避免出现Error: Could not find or load main class TestDemo.jar
在使用idea打包jar文件,执行java -jar xxx.jar后出现Error: Could not find or load main class TestDemo.jar找不到主类的错误。依照以下方式打包可解决此问题:...原创 2019-09-27 17:04:48 · 4255 阅读 · 4 评论