京东金融笔试

1.merge.mapfiles=true;     是否合并Map输出文件,默认true
2.merge.mapredfile=false;  是否合并reduce文件,默认false
3.左右外连接的问题
left outer join
right outer join
full outer join
left join
?hive不支持’left join’的写法;
?hive的left outer join:如果右边有多行和左边表对应,就每一行都映射输出;如果右边没有行与左边行对应,就输出左边行,右边表

字段为NULL;
?hive的left semi join:相当于SQL的in语句,比如上面测试3的语句相当于“select * from table1 where table1.student_no in

(table2.student_no)”,注意,结果中是没有B表的字段的。
4.技术   管理 (忘记题目)
5.两张表join的时候大表在后小表在前  ?hive 0.6 的时候默认认为写在select 后面的是大表,前面的是小表, 或者使用 /*+mapjoin

(map_table) */ 提示进行设定. hive 0.7 的时候这个计算是自动化的,它首先会自动判断哪个是小表,哪个是大表,这个参数由

(hive.auto.convert.join=true)来控制. 然后控制小表的大小由(hive.smalltable.filesize=25000000L)参数控制(默认是25M),

当小表超过这个大小,hive 会默认转化成common join. 你可以查看HIVE-1642.
6.select 40/5 from dual;      8.0                                                       《答错1题》
7.显示所有数据以及标题  set hive.cli.print.header=true;
8.select 1 from dual where 1<=1;  返回true
9.(null,100,50)返回100,是什么函数?COALESCE/coalesce 返回第一个不为null的值。
10.round(double,int)函数的使用,四舍五入规则int是小数后保留几位。
11.不是hive中的函数是merge?cast concat 。。。。
12.内表和外部表的区别?内部表删除时元数据和数据一并删除,而外部表仅删除元数据,不删除数据《答错2题》
13.split函数的使用  返回值为一个数组
14.year函数
15.文件压缩
16.map数量越大越好
17.hive中只有union all 没有union?                                                       《答错1题》
总结分析
 1. 子查询相当于表名,使用 from 关键字需要指定真实表名或表别名。
 2. hive 不支持union ,只支持union all
 3. 子查询中使用union all 时,在子查询里不能使用count、sum 等 聚合函数
 4. 两表直接进行union all 可以使用count、sum 等聚合函数
 5. 两张表进行union all 取相同的字段名称,可正常输出指定数据内容,且结果为两张表的结果集
18.Join查找操作中如果存在多个join,且所有参与join的表中其参与join的key都相同,则会将所有的join合并到一个mapred程序中。
19.插入操作,哪个正确 load overwrite into...
20.用count(*) 代替sum函数

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值