面经专栏-字节商业化大数据一面

1.自我介绍
2.个人信息和实习时长进一步沟通
3.问项目,进一步阐明下项目细节
4.HDFS备份文件数量
5.HDFS读文件底层原理
6.HDFS写文件底层原理
7.追问是写完一个文件就返回还是所有备份写完才返回
8.问MapReduce原理
9.问Hive内部表和外部表的区别
10.问Hivesql咋转换到MapReduce的
11.问Hive可以用啥作为元数据库
12.Hive和HDFS的底层架构的关系,什么地方用到HDFS
13.问了对资源调度了解多少(提了yarn,没深入学习过)
14.问Mysql索引用啥,为啥用B+树
15.问各种连接方式的区别
16.问平时用到的集群是用现成的还是自己搭建(虚拟机里面搭建集群)
SQL出了两道题,最开始出了道一个city列中数据格式是(南京,北京,深圳)这样的,求内连接的结果。。想了一会说不会,city列改成了(南京)这样只有一个城市名称的数据格式,直接内连接就行。
算法,问一个排序数组有一个数重复了,求重复次数。时间紧先写了循环遍历,然后说了二分查找的思路。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值