大数据面试题及答案 2018

最新推荐文章于 2024-07-08 21:25:45 发布

已转行此号停用

最新推荐文章于 2024-07-08 21:25:45 发布

阅读量5.5k

点赞数 1

文章标签： JAVA 大数据面试题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qianfeng_dashuju/article/details/79403163

版权

1. java内存模型

2.gc

3.编译好的scala程序，运行时还需要scala环境吗

Scala的代码执行是用REPL过程，ReadExecute Print Loop

4.object中有哪些方法

5.监测集群中的cpu，内存使用情况？

6、ArrayList中的Array长度超了是怎么增加的，一次增加多少？

---------------------------------------------------

linux的启动顺序

通电后读取ROM的BIOS程序进行硬件自检，自检成功后把计算机控制权交给BIOS中BOOTsequence中的下一个有效设备，读取该设备MBR找到操作系统，载入linux的bootloader，一般是grub。之后载入kernel，执行 /etc/rc.d/sysinit ，开启其他组件（/etc/modules.conf），执行运行级别，执行/etc/rc.d/rc.local ，执行/bin/login，最后shell启动。

使用过的开源框架介绍

Struts2

Spring

hibernate

mybatis

hadoop

hive

hbase

flume

sqoop

Zookeeper

Mahout

Kafka

Storm

Spark

擅长哪种技术

Hadoop。介绍

HIVE的优化

底层是MapReduce，所以又可以说是MapReduce优化。

1. 小文件都合并成大文件

2. Reducer数量在代码中介于节点数*reduceTask的最大数量的0.95倍到1.75倍

3. 写一个UDF函数，在建表的时候制定好分区

4. 配置文件中，打开在map端的合并

开发中遇到的问题

Hbase节点运行很慢，发现是Hfile过小，hbase频繁split。

修改了hfile大小。或者设置major compack设置为手动

Major compack设置为手动会出现什么问题

？

Zookeeper的二次开发

Flume 的实时和定时数据采集，项目和flume的解耦

Mogodb和hbase的区别

Mogodb是单机

Hbase是分布式？？

项目组多少人？人员分配？数据量？集群的配置？

已转行此号停用

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。