技术成熟
大数据实践不够
大数据大于数据分析
大数据人才企业培养的
核心技能
大数据团队构成 基础平台、应用平台、数据应用(用户画像、BI、用户行为分析)
大数据开发工程师 精通各个组件的原理。理解业务的需求,java,scala,hive
数据仓库工程师 数据建模,java,hive,python
算法工程师 机器学习算法,用户画像,推荐,
100PB
数十万
几千个节点
面试准备
个人角色的定位
大数据开发工程师
个人职业规划 2-3年 业务、技术、综合能力 微调
扎实的基本功 面试的时候要复习 数据结构,Linux,项目管理,开发流程
开发语言 最擅长 两个,深入到原理 java, python
公司、项目的回顾以及梳理 核心项目梳理清楚 跟求职岗位相关的重点回顾
业务细节要重视
项目梳理步骤:项目背景、项目设计以及架构、技术选型以及对比、实现的细节、项目的效果
简历的准备 简历的内容最好不要超过两页,掌握的内容不求全而求精
写真正擅长的,业务与技术、项目要突出重点 与求职岗位相关的重点描述
面试技巧
技术面(基本功、技术深度),业务项目面(通过不同项目考核技术的广度,以及实践能力),综合能力面(执行能力,沟通能力,协调能力)、HR面(求职意愿、稳定性,抗压性)
面试要点 常见考核点
Hadoop工程师 组件精通程度,精读面试相关组件的代码,并能针对各种应用中遇到的问题快速定位,java是基础。linux基础,然后精通某些组件
&&集群规模变大,文件数增多,node内存受限成为瓶颈,如何解决。 node水平扩展
敏感数据的安全保护措施 服务器访问认证,底层目录权限管理、hive表的权限管理、三层结合达到目标
hadoop实战,java核心技术
大数据开发工程师
面试要点
熟练使用相关的组件,针对各个组件在应用中的不同环节进行调优,能够充分发挥大数据的价值,不同组件有变化,java scala是常见的开发语言 hbase mapreduce storm
hbase rowkey如何设计 结合实际的项目
如何实现map reduce spout bolt
storm并发问题 容灾策略
数据仓库工程师
面试要点
熟悉各个组件,数据建模,数据分层模型,ETL流程,数据质量,数据安全相关知识
hive构建,相关组件mapreduce spark hivesql
hive mr开发的时候 数据倾斜怎么办, 怎么去优化,怎么去分析
数据建模常用的方法和模型 数据仓库建设的优点,解决了哪些痛点,数仓规划 模型设计
日志系统的ETL环节 具体每一步都做了那些事情 数据质量是如何保证的
数据分析师
sql基础 hivesql python 数据分析项目的流程 采集、整理、数据建模、分析、报告的产生、行业相关的指标定义
指标体系 分别是怎么定义的
算法工程师
算法理论知识、工程实现能力和编码水平,业务的理解能力和思考的深度
统计学 数学基础知识 矩阵变换、特征值
算法方面 各种常见的机器学习算法的原理和区别,常用调优的方法
数据结构、搜索方法
推导,原理,广告点击的预估,用了哪些数据,那些算法实现的
大数据职业发展通道,进阶之路
集群规模、公司的业务模式 职业发展的瓶颈
技术路线 管理 技术型管理
迷茫期 重复工作 差异变化小 没有职业规划
30-40岁 黄金阶段 业务范围扩张计划、技术广度深度提升计划、沟通协调,综合能力
1、开发语言问题 不同岗位对语言要求不一样 明确的角色定位,然后再掌握语言
2、转岗转行 2-3年职业规划
3、学历问题 简历要求匹配。都会给面试机会
4、自学&培训班 不是很重要,影响不大,看中之前的技能,和之前的项目是否相关或者匹配