上海极贝科技笔试题

最新推荐文章于 2021-04-28 20:07:29 发布

Coder杨公子

最新推荐文章于 2021-04-28 20:07:29 发布

阅读量506

点赞数

分类专栏：面经

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/big_data1/article/details/80874302

版权

面经专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、Java中map，list,set的区别是什么？

1.继承的接口不同

List和set接口都是继承于Collection接口的，而Map接口不是，他是一个顶层接口。

2.自身特点

List：用来处理序列的。对于放入的元素是有序的并且可以重复。

Set：用来处理集合的。对于放入的元素是无序的并且不可重复。

Map：用来处理键值对。Key值不能重复，如果重复，则会被覆盖，并且放入无序。

二、请用shell命令把hadoop集群中的某一个文件下的所有文件分发到其他的机器上？

方式一：scp -r /opt root@10.10.10.10:/opt

-r表示递归复制

方式二：rcp -r /opt root@10.10.10.10:/opt

三、如何正确杀死一个运行在hadoop中的job？

1.查看当前正在执行的进程：

sh hadoop job -list

2.执行杀死进程的命令：

hadoop job -kill job_201212111628_11166

四、在做hbase和hive表设计时，如何正确选择一种合适的数据压缩算法？

Hadoop中常用的压缩算法有bzip2、gzip、lzo、snappy，其中lzo、snappy需要操作系统安装native库才可以支持。

其中：

1）GZIP的压缩率最高，但是其实CPU密集型的，对CPU的消耗比其他算法要多，压缩和解压速度也慢；

2）LZO的压缩率居中，比GZIP要低一些，但是压缩和解压速度明显要比GZIP快很多，其中解压速度快的更多；

3）Zippy/Snappy的压缩率最低，而压缩和解压速度要稍微比LZO要快一些。

我们集群现在hive设置默认snappy压缩，

而parquet的压缩格式设置为parquet.compression=snappy，

以前setmapred.output.compression=org.apache.hadoop.io.compress.SnappyCodec不起作用。

Orc的压缩格式设置方法为：orc.compress=SNAPPY,默认为ZLIB.

五、Hive中insert into和override write区别？

insert into：将某一张表中的数据写到另一张表中

override write：覆盖之前的内容。

六、Hive表被锁，导致drop和insert命令均不可用，应当如何解锁？

发现表(fact_hz_zlfa)被锁,

临时解决方案：对表解锁

unlock table fact_hz_zlfa ;

彻底解决方案：

find / -name hive-site.xml

关闭锁机制：

set hive.support.concurrency=false; 默认为true

欢迎关注我的公众号——数据杨公子。本公众号会分享包括但不限于大数据、数据治理、元数据管理、python 等方面的技术文章，主旨是和大家一起共同成长，用技术来认识我们这个数据的时代。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JKJ6DjY6-1582591094615)(https://img.hacpai.com/file/2020/02/image-346a3140.png)]

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Coder杨公子 CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

10万+: 周排名

183万+: 总排名

28万+: 访问

: 等级

1426: 积分

28: 粉丝

122: 获赞

25: 评论

502: 收藏

私信

关注

热门文章

分类专栏

ELK 1篇
Linux命令 1篇
springboot 1篇
Mysql方法论与实践 1篇
python 1篇
数据管理 1篇
手撕LeetCode 6篇
安装教程 1篇
WEB 1篇
面经 2篇
项目构建 1篇
scala 4篇
那些年踩过的坑 4篇
自己造的小轮子 1篇
hive 1篇
shell 2篇
Java 1篇
kudu 6篇
spark 1篇
工具 1篇
Docker 2篇

最新评论

IDEA 同一个工程下不同模块之间的类相互调用（Maven工程）
逮到一只神明啊: 哈哈不好意思没注意时间，大佬还在干开发嘛
IDEA 同一个工程下不同模块之间的类相互调用（Maven工程）
逮到一只神明啊: 循环引用就懒加载一下，前两天刚刚遇到
Docker（二）：一个简单的Dockerfile实例
愚且憨: 直接使用文章中提供的dockerfile文件练习会出现： > [3/4] RUN apt-get update && apt-get install -y nginx: 0.414 Ign:1 http://mirrors.aliyun.com/ubuntu raring InRelease 0.491 Err:2 http://mirrors.aliyun.com/ubuntu raring Release 0.491 404 Not Found [IP: 183.2.193.240 80] 0.493 Reading package lists... 0.500 E: The repository 'http://mirrors.aliyun.com/ubuntu raring Release' does not have a Release file. ------ Dockerfile:13 -------------------- 11 | # 3、镜像操作指令 12 | RUN echo "deb http://mirrors.aliyun.com/ubuntu/ raring main universe" > /etc/apt/sources.list 13 | >>> RUN apt-get update && apt-get install -y nginx 14 | RUN echo "\ndaemon off;" >> /etc/nginx/nginx.conf 15 | -------------------- ERROR: failed to solve: process "/bin/sh -c apt-get update && apt-get install -y nginx" did not complete successfully: exit code: 100 原因：Ubuntu 版本 "raring" 已经被归档（archive）并不再可用解决方法：将ubuntu版本改成18.04或20.04，如：FROM ubuntu:18.04
Spark SQL 读取hive分区表出现分区字段为null的情况
m0_59725528: 超棒，解决了我的疑问。查了下确实是分区字段本身存在null值。
SpringBoot java.lang.NoClassDefFoundError: org/eclipse/jetty/server/RequestLog$Writer
Ares_2020: 感谢一样的场景一样的问题

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。