![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据面试题
劝学-大数据
不断尝试,永不认输
展开
-
中软-华为-兰州移动-二面
4.如果别人指出你的问题,让你修改,你该如何应对?5.linux命令是否熟悉,能看懂相关代码吗。3.工作中遇到问题,如何解决?7.笛卡尔积,内连接和左连接。6.sql能否进行相关修改?原创 2024-05-07 19:42:16 · 118 阅读 · 1 评论 -
做题速度太慢了,面不上
sql题,腾讯四道sql题,限时45分钟完成。我只做了一道,还没做完,太难受了。没办法,看表我都看了15分钟,可见太生疏了。不要老说机会给有准备的人,我想说,时机缺一不可,时间,机会。没办法,之前练了一个月的sql。两个月不写,现在差不多忘干净了。工作空窗期,或者休息期不能太久,不然学再多的内容都可能会忘完的。原创 2024-05-07 14:08:57 · 3739 阅读 · 4 评论 -
数据开发-面试真题。
谈及工资时,巧妙避开,其实我觉得我期望取中位数,可能不大行,所以干脆不说。16.面试过程中,技术面试官问的一些基础没答上来,比如项目中的flink的基础,java基础,以及项目中是如何实现的。举例说明自己平常在做什么的时候,也有提到自己是一个有心之人,其实恰恰相反,自己是个无心之人。7.给定一系列字符串,从集合的set和list中查询,如何查询出相关的数据,同时set和list有什么区别。15.反问,1.公司是提取数据 2.公司的数据支撑 3.公司的数据维护 4.公司的组件。10.未来的个人的生涯规划。原创 2024-04-03 23:01:34 · 391 阅读 · 0 评论 -
某小外包面试-数据库工程师
然后hr介绍了公司的基本情况, 福利待遇还是挺快的,10几分钟搞定。只是有点奇怪,由hr一面,一般都认为应该是其他的二面。有一点,就是面试好像迟到了,因为进错在线会议室的房间了。8.曾经工作的公司名称?3.介绍一下在苹果的数据分析实习经历。7.为什么要来该城市?2.未来两三年的打算。原创 2024-03-27 16:03:17 · 133 阅读 · 0 评论 -
某小型外包—ETL工程师面试
select a.* ,b* from a left join b on a.id = b.id 先join 再 select。同时反问,用到的组件有dataworks, 可能用到python。9. 从kafka中消费数据的命令。没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。1.datax和sqoop的对比,优点与缺点。如何修改linux的文件的属性。8.1 java的数据结构有那些。10. 如何进行数据建模,常见的模型。3.数据采集到数仓中,做了那些清洗。2.sql的执行顺序。原创 2024-03-14 21:17:55 · 446 阅读 · 0 评论 -
耗时两个月找工作以 0 offer告终,原因记录
我在11月底开始找工作,耗2个月,找到1月末,仍然没有收到offer。要说找不到工作,无非两种,一是技术菜,比如手写sql,或者组件的底层原理,项目讲解等等。二是形象, 比如我自己有唇炎,10年唇炎,就是收拾一下, 面试的时候面试官看到我的嘴唇都会抿嘴,以及穿的衣服显得不怎么整洁,我穿过比较油腻的衣服,衣服有很多油渍,看起来脏,然后裤子也是加厚牛仔裤,也不大好看,鞋子更是黑色皮鞋,一层灰,头发也是不够柔顺较乱,个人形象真感觉没几个人能比我差的了,当然那些形象比我差的可能还是技术上的大佬,而我是菜鸡。原创 2024-02-02 12:36:16 · 93 阅读 · 0 评论 -
某汽车外包-大数据开发-面试
在回答spark rdd的原理时,我也一样没记住。这些面试题上都有的东西我都没记住。我不禁想,学gbase有什么用,还不如敲敲过去的代码,起码找工作会用到,这些类似的国产数据库学了用不到,跟学hbase有什么区别。在回答分桶表的时候,我在思考,其实我可以干脆说自己不清楚,没用过。在回答clickhouse的分表概念时,我也是一样不清楚。9.datax用来干什么的,datax是用什么语言编写的。8.分桶表和分区表的区别,分桶表的设计未来解决什么问题。6.clickhouse怎么建表的,什么是分表。原创 2024-01-19 15:17:34 · 359 阅读 · 0 评论 -
某大公司-数据分析-面试
面试之前,面试官说了,这次面试是根据以往经历,进行一些提问,然后从回答中进行一些追问。3.在工作中,与同事有歧义的地方,发生矛盾,如何在开展工作的时候,与对方沟通,5.你与那些人对接工作。在碰到一些工作上的问题时,你是跟他们怎么进行处理的。6.你一直保持做的一件事情是什么,从中遇到过那些问题,怎么解决的,收获了什么。2.工作中遇到过最失败的地方,从中收获了那些内容?(知识,成长,技能)既能保持工作进展,又能跟对方更好的关系。4. 你是怎么知道自己掌握一门新技术的。原创 2024-01-18 17:56:21 · 441 阅读 · 0 评论 -
大数据开发-面试
3.公司安排任务或遇到问题时是怎么解决的。2.公司用到的技术栈有那些。回答:1.公司招人来解决什么问题。5.shell脚本做过那些事情。7.遇到什么问题,怎么解决的?3.有没有用过spark。4.讲一下数仓分层。原创 2024-01-16 18:39:09 · 347 阅读 · 0 评论 -
ETL工程师-面试
6.项目中为什么使用orc和snappy?对比其他的存储算法,有什么好处。4.2 hive中的一个表分区的数据怎么导入到另一个表中的分区中。Flink中在kafka中数据重新再写回到kafka里面有什么好处。4.3 如果一个字段 不为空,取空值,如果字段为空,取默认值。7.你们是自己做运维的吗,集群中出现一些问题,该如何解决。4.1 如何把服务器中的数据上传到hive表里面。面试过程中出现了一些卡顿,主要是场景题时。4.4 udf, udtf使用场景。5.Flink的数据一致性。3.说下自己写过的脚本。原创 2024-01-16 11:02:08 · 434 阅读 · 0 评论 -
某大公司-大数据开发-二面
这里我回答:自己刷题,加整理简历。然后对方领导反问我一直在找工作,我说是。3.假如我是刚来的,如果我做的任务不是很好,领导和下级觉得我做的不是很满意,我该怎么办。我觉得我思考问题的时候都慢了半拍。然后一天面试三场真的很累。------------- 以后打死一天至多面试两场。1.来了公司,你知道这个岗位需要做什么吗。2.你之前休息的几个月,你都干了什么。发现甲方这种公司都喜欢问场景题。原创 2024-01-12 18:33:44 · 687 阅读 · 0 评论 -
某国企-大数据开发-二面
我在回答小文件的时候有点卡住了,因为我说小文件大小的时候,说小文件大小为16k认为是小文件, 然后面试官问为什么,我说因为mapjoin默认小文件大小是16k,达到256k会进行滚动。如何解决的,小文件多大。5.datanote挂了怎么办,小文件会造成那些问题。7.之前工作中遇到过得最困难的问题,提1~2个。然后想起来自己说话有点卡顿,但我还是说完了。10.superset可以设置参数吗。显然不是一个正确的理由。8.工作中最有成就感的事情。6.数据倾斜的原因有哪些。11.用到的工具有哪些。原创 2024-01-12 11:32:33 · 319 阅读 · 0 评论 -
某大公司-数据分析-一面
还有我自己提问的时候,我问的是:以您对我的了解,我多久可以适应公司的岗位,其实我觉得把适应改为上手才好,如:我多久可以上手公司的岗位。因为提前进入,发现前面还有人在面试。然后看见面试的小姐姐最后提问:入职后,公司有什么入职安排,入职培训的话语。4.用过哪些函数,排名函数的区别,给1,2,3,4 三者有何不同。udf函数是怎么做的。6.clickhouse和prestro的区别。5.对于造成单个数据倾斜的key,如何解决的。3.数据倾斜的原因有那些,如何解决的。2.实时数据流程如何做的。原创 2024-01-11 18:37:23 · 415 阅读 · 0 评论 -
某外包~大数据开发~项目经理二面
两个sql回答的都不好,我好久没写sql了,还要面试官提示我,我才能回答一点,回答不好的,人家直接给我解释了,就挺尴尬的。一面通过后,hr开始谈工资,以为外包一面就能拿下,没想到还是要我来公司聊一聊。2.求学生表中,学生的最大成绩,成绩是varchar类型。感觉自己不太行,估计不好过,给面试官的印象也一般。1.对于交易明细表中,求每个用户最大的日期的交易记录。突然想起来自己啥也没问,就问了加班。然后问我有什么想问的?后面问了一下交通,个人情况。4.两道sql题,直接问的。2.公司是做什么业务的。原创 2024-01-08 11:22:15 · 406 阅读 · 1 评论 -
大数据开发-面试-小自研公司
4.公司团队多少人,服务器多少台,物理机还是云主机,任务分配,大数据团队多少人,你做什么,其他人的职务?这个岗位应该是招聘大数据负责人这种,但是我给自己的角色是参与者,因为面试的挺多人,所以感觉没什么希望。2.如果从京东,淘宝获取到相关数据,如何根据客户数据,给用户推送喜好的数据,提个方案?6.物理机和公司的服务器之间的数据如何如何做到连通的?3.有没有做过机器学习相关的项目,回答没有.7.你对自己未来的发展规划?原创 2024-01-05 14:55:25 · 352 阅读 · 0 评论 -
数据库工程师—面试
3.写过最复杂的SQL, 如路径分析,流失,回流用户数我说的不清楚,然后七天内连续三天这种我根本不敢说。以上,既反映了我没有背熟面试题的问题,又说明了我SQL写的一般。1.kafka原理说的不清晰,遇到什么问题这块。4.kafka遇到哪些问题,怎么解决的?2.数仓每层做了什么事说的层次感不清晰,6.遇到不熟悉的数据库,多久能够掌握?3.数据采集之后,做了那些流程?5.写过最复杂的SQL,说一说?2.数据采集的业务场景?7.你还有什么想问的?原创 2024-01-04 10:51:00 · 379 阅读 · 0 评论 -
某大厂外包-大数据面试-人事提问
正在睡觉的时候,突然一个电话过来,然后接听开始。4.提到数据整个过程,遇到问题如何解决的?6.沟通能力如何,需要涉及客户之间的沟通?7.平常项目中遇到故障如何解决的?3.用过那些linux命令。2.数据流程是怎么样的?原创 2024-01-02 18:51:33 · 383 阅读 · 0 评论 -
某外包-甲方保险公司初步面试 + 某外包-甲方银行面试
因为是发生在同一天,面试时间又短,两个都没有超过10分钟,所以记录一下。4.因为甲方是做保险的,对于传统数仓的sql有一定的要求,所以没有面上。3.因为我第2个没有回答上来,告诉我甲方问的比较深,可能面不上。2.介绍一下之前遇到的问题,印象深刻,如何解决的。2.描述一个存储过程如何写的。1.是否了解存储过程。3.项目流程介绍一下。原创 2023-12-28 19:20:25 · 368 阅读 · 0 评论 -
数据开发-面试
上来是乙方经理带我进去,然后领到笔记是题,都是sql,不难,但是我30分钟才做了3道,8道题,反映出我基础不牢,连sql都写不熟练。5.海豚调度器遇到问题怎么解决的?3.对于sql卡住,如何解决?2.介绍流程,整个开发流程。6.关于报表工具使用。原创 2023-12-27 02:09:58 · 365 阅读 · 0 评论 -
面试的感受
人家还问的tob 和toc的区别。原创 2023-12-22 19:32:29 · 331 阅读 · 0 评论 -
德拓外包-大数据开发面试
面试官指点,认为hive sql只要熟悉就能胜任工作,在掌握一门计算语言,如java,python,就能干好工作。3.hive,两张表的重复数据,怎么去重?4.udf函数写过吗,flink消费kafka中的数据写过代码吗,需要看代码?都在公司的库里, 银行金融项目谁让你把代码带出去的,就是公司业务保密。不足:对于简历上的内容,回答支支吾吾,甚至不能开口,所以面试失败。1.面试官要是要看以前写过的代码,要共享屏幕怎么办?原创 2023-12-07 11:55:26 · 58 阅读 · 1 评论 -
某大型外包公司-大数据开发面试题
原创 2023-11-29 23:04:50 · 39 阅读 · 1 评论 -
大数据开发-数梦工厂部分面试题
5.栈的进栈和出栈,全错,第一题是第一项对,第二题是地三项对。6.关于控''和null在表中的影响。3.HashMap,正确答案第二项。2.占位符,正确答案第一项。4.视图,正确答案第二项。原创 2023-11-28 23:20:57 · 48 阅读 · 0 评论 -
某小外包公司线上面试-大数据开发
4.rank,dense_rank,row_number的区别。(感觉说出来就无了)5.hive数据倾斜的原因有哪些。6.java,scala会用吗?1.公司开发人员占比?1.数仓和数据库的区别。3.hive用到的函数。7.如何理解数据质量?原创 2023-11-27 22:00:46 · 60 阅读 · 1 评论