自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 HIVE内部函数

Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。数学函数 Return Type Name (Signature) Description DOUBLE round(DOUBLE a) Returns the roundedBIGINTvalue ofa. 返回对a...

2020-05-24 23:52:03 199

原创 hive基础用法

1, 内部表和外部表内部表:hive(HDFS系统中)中的表:create table t_2(id int,name string,salary bigint,add string)row format delimitedfields terminated by ',';外部表:系统磁盘中文件映射表create table t_2(id int,name string,salary bigint,add string)row format delimitedfields ter

2020-05-21 00:06:43 204

原创 HIVE基础

1,HIVE是什么?HIVE是一个可以将sql翻译为MR程序的工具HIVE支持用户将HDFS上的文件映射为表结构,然后用户就可以输入SQL对这些表(HDFS上的文件)进行查询分析HIVE将用户定义的库、表结构等信息存储hive的元数据库(可以是本地derby,也可以是远程mysql)中2, HIVE的用途?解放大数据分析程序员,不用自己写大量的mr程序来分析数据,只需要写sql脚本即可HIVE可用于构建大数据体系下的数据仓库3,HIVE的使用方式?方式1:可以交互式查询: ** b..

2020-05-20 00:08:57 95

原创 zookeeper基础java的API与监听节点数据变化案例

java使用AP:import java.io.UnsupportedEncodingException;import java.util.List;import org.apache.zookeeper.CreateMode;import org.apache.zookeeper.KeeperException;import org.apache.zookeeper.ZooDefs.Ids;import org.apache.zookeeper.ZooKeeper;import org

2020-05-17 01:10:31 503

原创 Mybatis解决In查询条件过长的问题

方法1:分次查询,将参数且分割成多个短的查询后合并代码: int splitNum =(int) Math.ceil( (float) ids.length/999); //切片数量 List<String> itemIdList = new ArrayList<>(Arrays.asList(ids)); List<List<String>> splitList = averageAssign(itemIdList

2020-05-13 17:28:57 3175

原创 zookeeper基本概念,应用场景与安装

1,功能:1)为客户端管理少量的数据(kv形式)2)为客户端监听指定数据节点的状态,并在数据节点发生变化时,通知客户端(监听数据,数据变化时通知客户端)2,搭建1,上传安装包,解压2,修改conf/zoo.cfg(数据存放位置与各个节点ip与端口)# The number of milliseconds of each ticktickTime=2000# The number of ticks that the initial# synchronization phas

2020-05-09 00:36:15 118

原创 MapReduce程序在yarn上启动运行过程

客户端提交mr程序job的流程:1,客户端提交job后(job.submit()),Yarn的ResourceManager会返回本次所提交的job的提交路径(hdfs://xxx../staging)和jobid,然后拼接为一个job的资源提交路径 (hdfs://…./staging/jobid)2,然后会将1)job的切片规划(调用FileInputFormat.getSpl...

2020-05-08 00:18:28 517

原创 maptask端数据倾斜

数据:a a a a a a b b b a a a a a a a c c b c a a a ca b b c a a d d e e f ff g a a a b a b h h g j需求:wordcount问题:a特别多,负责处理a这个单词数据的reduce worker就会很累(负载不均衡,过大)解决方法1:MapTask端每次处理完数据后做一次局部聚合(每次切...

2020-05-05 23:32:40 230

原创 hibernate时间查询

SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); Calendar cal = Calendar.getInstance(); cal.add(Calendar.DATE, -5); String beginTime = sdf.format(cal.getTime()); Str...

2020-05-05 10:19:58 368

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除