最全大数据面试求职经验总结_大数据专家面试,2024年最新2024大数据开发面经

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

5)熟练掌握Sqoop(SQL-to-Hadoop)的工作的原理,运作流程,实现数据 在各组件之间的传输;

6)熟练掌握Kafka分布式消息队列的架构。能够使用Kafka和Flume结合对 实时数据进行简单的处理;

7)熟练掌握Zookeeper(分布式协作服务)的架构,工作原理;

8)能够使用Oozie(工作流程调度器)进行程序流式运行;

9)掌握Git管理工具。

模板2

■ 语言

1.Java

•熟悉JVM的垃圾清理机制和调优,理解Java多线程的技术;

•拥有OOP的思想,能够熟练地使用Java语言进行MapReduce以及Spark的开发。

2.能够熟练使用Scala语言进行Spark的业务开发。

3.熟悉Linux命令,能够编写Shell脚本。

4.精通SQL语句,能够进行Hive和SparkSQL的开发。

■ 框架

1.Hadoop

•熟悉HDFS的读写流程,并能用其进行海量数据的存取;

•熟悉MapReduce的运行流程,并能用其进行海量数据的分析;

•熟悉Hive的原理,能够熟练使用hql语句以及自定义UDF进行Hive的数据分析,能够进行Hive的调优;

•了解ZooKeeper的原理,能够使用ZooKeeper对集群进行协同服务;

•理解HBase的特性,能够使用HBase进行数据的存储,能够完成HBase的表设计;

•熟悉Flume的框架,能够使用Flume实现不同场景下的数据采集;

•熟知Sqoop的原理,能够使用Sqoop实现不同场景下的数据传输。

2.Spark

•熟悉Spark的框架以及Spark任务的执行流程;

•熟悉RDD的属性,能够使用RDD算子进行Spark Core的开发;

•精通SQL,能够进行Hive on Spark以及SparkSQL的开发;

•能够使用Spark Streaming进行实时处理;

•理解消息中间件Kafka的原理与结构,能够完成Kafka与Spark的对接。

■ 工具

1.熟悉IEDA/Eclipse开发工具,熟悉Git版本控制工具;

2.熟悉数据库连接工具Navicat和Linux系统远程连接工具MobaXterm;

3.熟悉数据仓库建模工具PowerDesigner,能够完成ODS层,DW层以及DM层的设计。

■ 数据库

1.精通SQL语句,熟悉MySQL数据库;

2.熟悉Redis的数据类型以及常规操作,了解Redis的持久化和主从配置。

■ 其他

1.熟悉数据仓库的建模,掌握星型模型和雪花模型的设计;

2.了解二叉树、红黑树的排序算法,了解二叉树的遍历算法。

简历模板:

可以使用招聘软件上的在线简历,填写后导出,也可以在专业简历网站上编写,如五百丁、超级简历等,不建议直接在word模板中改,容易出现格式错误。

其他注意事项:

1.简历中的学校课程校招可以选择性填写 ,有社招经验的不需要。

2.简历内容充实时自我评价可不写。

3.简历中的照片可以不加,留神秘感。

4.求职是双向选择。

二、常见问题

三、求职软件

互联网行业首推招聘网站:BOSS、拉勾

注意:一定要在找工作面试前提前写好在线简历,如果简历符合公司要求,HR会主动联系你投递简历。

校招要提前去公司官网投递简历,尽量熟人找内推。

四、知识体系

每个岗位的知识体系不同,这里我熟悉的以大数据为例,知识点很多,但不一要全会,围绕自己简历中技能或项目班包含的技术,挑自己的强项写进简历中。

1.大数据体系

**数据采集传输:**Flume(进)  Kafka(缓冲池)  Sqoop(出)  Logstash – ELK  Data X – 阿里

数据存储:

MySQL – 模拟java后台的数据

HDFS – Hive

HBase – kylin,

实时的kv格式数据  Redis – 缓存  MongoDB – 前端

数据计算:

Hive – 底层是mr

Tez – 基于内存

Spark – 计算引擎(多表)

Flink – 支持实时的单条数据处理与批处理(多表,被阿里收购,取名Blink,添加了很多新特性)

Strom – 实时处理(old)

数据查询:

Presto – 基于内存(快速查询,Apache)

Druid – 德鲁伊(只支持单表、宽表查询)

Impala – 基于内存(快速查询,CDH)

Kylin – 预计算,预聚合,多维度(国人开发的Apache顶级项目)

数据可视化:

Echarts – 百度开源,需要绘图,使用难度高

Superset – 免费开源,适合中小型企业使用,简单轻量

QuickBI – 收费

Data D – 收费、酷炫

**任务调度:**Azkaban  Oozie – CDH内部集成,web页面安装即可

集群监控:Zabbix – 报警(通过邮件、钉钉、甚至电话通知,属于专业运维使用)

元数据管理 Atlas – 可以用来管理hive的元数据,形成血缘依赖关系

另外,推荐几个优秀的大数据面试系列博客:

1.《大数据面试题》面试大数据这一篇就够了_abluer~的博客-CSDN博客_大数据面试

五、面经

推荐观看:短时间内准备面试技巧 | 通过大厂面试 | 基础知识、项目和算法

【2个月通过秋招】短时间内准备面试技巧 | 通过大厂面试 | 基础知识、项目和算法_哔哩哔哩_bilibili

面经有时候比你的技能知识储备更重要,通过心仪公司的面经有助于你看准方向,充分应对面试。

牛客网:看面经+刷题

LeetCode算法:进大厂算法必刷

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

片转存中…(img-b7ucmmW1-1715477989566)]

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大数据开发中,Shell脚本是非常常用的工具。以下是一些常见的面试问题和答案: 1. 问: 如何执行一个已经创建的Sqoop job? 答: 可以使用以下命令执行Sqoop job: sqoop job -exec job名称 。 2. 问: 你使用过哪些Shell脚本? 答: 我使用过awk、sed、cut和sort等命令来处理文本数据。我还写过一些用于集群启动、脚本分发、数据导入导出以及数仓层级内部导入的Shell脚本 。 3. 问: 如何通过Shell脚本杀死远程服务器上的进程? 答: 有两种方法可以杀死远程服务器上的进程。一种是使用以下命令: ssh $i “ps -ef | grep 进程名 | grep -v grep |awk ‘{print $2}’ | xargs -n1 kill”。另一种是使用以下命令: ps -ef | awk ‘/进程名/ && !/awk/ {print $2}’ | xargs -n1 kill -9 。 4. 问: Shell中单引号和双引号有什么区别? 答: 在Shell脚本中,双引号可以保留变量的值并将其扩展,而单引号则会将变量视为普通的字符串。双引号内的特殊字符会被解释,而单引号内的特殊字符会被视为字符串的一部分。此外,双引号内可以使用转义字符来表示特殊字符,而单引号不支持转义字符 。 希望以上回答对你有所帮助。如果你有其他问题,请随时提问。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [shell编程之大数据面试题](https://blog.csdn.net/qq_27924553/article/details/111938876)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [大数据高频面试题——linux&shell-详解](https://blog.csdn.net/zlmldylinke/article/details/113886037)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值