自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 hadoop,hive,hue,impala安装与启动

hadoop,hive,hue,impalaHadoop安装配置启动Hive安装hive的补充配置方便使用启动Hue安装Hue整合Hadoop、Hive启动Impala安装准备本地yum源安装Impala启动Hadoop安装规划安装安装代码tar -zxvf hadoop-2.9.2.tar.gz -C /opt/lagou/servers添加Hadoop到环境变量 vim /etc/profile##HADOOP_HOMEexport HADOOP_HOME=/opt/lagou/se

2021-01-21 23:09:55 719

转载 hive启动查询错误

https://www.cnblogs.com/mrma/p/13252097.htmlhive连接出现FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClienthive的conf中如果配置

2021-01-20 19:15:25 191 1

原创 Hadoop-rm综合案例2.分区排序多目录输出

rm综合案例-好差评代码实现Mapperbean分区器自定义OutputFormatCommentOutputFormat问题与总结RecordWriterReduceDriver需求现在有一些订单的评论数据,需求,将订单按照好评与差评区分开来,将数据输出到不同的文件目录下,数据内容如下图,其中数据第九个字段表示好评,中评,差评。0:好评,1:中评,2:差评。现需要根据好评,中评,差评把数据分类并输出到不同的目录中,并且要求按照时间顺序降序排列。分析自定义InputFormat合并小文件自定义

2021-01-09 17:08:38 342

原创 Hadoop-rm综合案例1:合并小文件

分析自定义InputFormat合并小文件自定义分区根据评论等级把数据分区自定义OutputFormat把数据输出到多个目录2.自定义InputFormatpackage com.lagou.mr.comment.step1;//自定义inputformat读取多个小文件合并为一个SequenceFile文件 //SequenceFile文件中以kv形式存储文件,key--》文件路径+文件名称,value-->文件的整个内容 import org.apache.hadoop.fs.

2021-01-09 16:46:59 236

原创 综合案例中的几个点

2021-01-09 15:43:36 88

原创 MapReduce读取与输出

文章目录InputFormatCombineTextInputFormat案例⾃定义InputFormatInputFormat运⾏MapReduce程序时,输⼊的⽂件格式包括:基于⾏的⽇志⽂件、⼆进制格式⽂件、数据库表等。那么,针对不同的数据类型,MapReduce是如何读取这些数据的呢?InputFormat是MapReduce框架⽤来读取数据的类。InputFormat常⻅⼦类包括:TextInputFormat (普通⽂本⽂件,MR框架默认的读取实现类型)KeyValueTextInp

2021-01-08 23:42:06 935

原创 Hadoop分区排序

Hadoop全排序相关分区排序要点思路分析代码示例CustomGroupingComparator代码CustomPartitioner代码Mapper代码Reduce代码OrderBean代码Driver代码总结流程示意要点2 分区排序(默认的分区规则,区内有序)直白讲解:CustomGroupingComparator帮助我们实现Reduce分组的时候来制定我们的分组规则。然后再在组内进行排序,即实现分组排序。例如:按照订单id分组,然后排序,得到每个订单中价格最高或最低的商品id或价格。直

2021-01-08 19:19:03 839

原创 Hadoop中全局排序的实现流程

文章目录要点一、参考代码mapper代码如下:reducer代码如下:bean代码如下(省略getset):Driver代码如下:总结要点1. ⾃定义对象作为Map的key输出时,需要实现WritableComparable接⼝,排序:重写compareTo()⽅法,序列以及反序列化⽅法2. 再次理解reduce()⽅法的参数;reduce()⽅法是map输出的kv中key相同的kv中的v组成⼀个集合,调⽤⼀次reduce()⽅法,选择遍历values得到所有的key.(选择便利所有key将所有v按

2021-01-08 17:26:26 491

原创 Hadoop流程

Hadoop流程Mapperpackage com.lagou.mr.wc;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;import java.io.IOException;//单词计数//继承Mapper类//Mapp

2021-01-05 10:31:44 194

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除