数据平台开发实习生系列之——学习规划

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey

大概是从2015年2月份开始接触大数据相关的,在假期的时候,没有回家,留在了302实验室,现在想想那时候都学了什么?那时候和一个死大四的老学长还有两个14届的学长住在实验室里过着一箪食一豆羹的纯粹生活,在某个夜里死大四的老学长让我们去抬服务器,这是干什么?他说搭环境,后来了解到就是在搭hadoop这个平台,印象中老学长Python玩的比较溜,看他用MAC book弹出的黑色命令行写python脚本,觉得很厉害,当时怎么就没多问几句呢?或许就能多学一些。人的好奇心还是很重要的,最好强烈一些。所以也就是从那时候开始,去了解了大数据这个东西,百科了一下Hadoop词条,“Hadoop的框架最核心的设计就是:HDFS和MapReduce。”
然后就踏进了数据平台的这个坑,就有了后来的002如何构建hadoop集群环境?
这只是第一步,搭建环境而已,却耗费了我很多时间,比如Linux命令行都是现查现用的,还有实际的网络拓扑等,为了做数据可视化还得学习一些前端的知识,这么一年的时光好像什么都学会了一点,然后却还没有真正入门,所以还被我的好兄弟王二狗狠狠地鄙视了一把,“我都不想说你了,学不精,兴趣爱好太多了。”

数据平台开发工程师,
现在需要为公司提供数据存储、分析、计算、可视化支持,熟悉分布式计算及存储系统,有大规模数据集处理经验,了解 OLAP 开发更佳。熟悉 SQL 查询语言。比如有这么一个具体的职业规划,那你需要具备哪些技能?假设在公司环境下,作为一个新入职的菜鸡,你不可能有优待在需要写一个数据可视化的时候,让你找到一个同事来给你做。需要写把数据存到数据库的时候,再找另一个同事来给你做。

现在的确是最宝贵的时光,需要经常问问自己”你学到了什么?“这是一个很重要的问题,对自己的学习成果进行及时的量化总结和对下一步学习的规划。

下面进入正题:
为大家介绍也是给自己理清学习思路以及方向,如何成为数据平台工程师入门之如何成为数据平台开发实习生系列之学习规划。
知乎数据平台开发实习生职位描述:

参与知乎数据平台,数据仓库的设计与开发

任职资格:

    计算机相关基础知识扎实
    熟悉 Python、Java、Scala 等编程语言
    对技术有钻研精神,学习能力强
    良好的工程及工作习惯,了解知乎产品
    熟悉 Hadoop, Spark, Hive 等开源项目

加分项:

了解常用的数据结构和算法
写过 MapReduce, Spark, Hive UDF 程序

Step1:构建技能图谱
参考知道创宇研发技能表v3.1

1.熟练使用Python进行数据分析
2.熟悉Hadoop,Spark平台架构以及原理
3.Hive:数据仓库工具
4.Pig: 大数据分析平台
5.Hbase:分布式列存数据库
6.Hue: Hadoop 图形化用户界面
7.6.Zepplin:Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化。背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo。

Step2:安排一份学习计划然后执行之
原则:至少完整看完与练习好一本书
至少过一边官方文档

1.上手Linux
2.熟练VIM
3.上手python
4.使用Spark平台开发Python项目
5.熟练使用Spark SQL
一份靠谱的学习书籍:
《Head_First_Python(中文版)》
《利用python进行数据分析》
《Python核心编程3》
《Python数据分析与挖掘实战》//我家小菇凉送的必须珍藏一辈子啊!
《鸟哥的Linux私房菜——基础篇》
《Spark官方文档中文版》
《Hadoop权威指南3》
《深入理解MySQL核心技术__中文版》
《深入浅出 SQL(中文版)》

当前精力有限还是决定先把Python搞定,所以重点放在编程学习上。

最后引用《知道创宇研发技能表v3.1》的一个学习思想:Learning by Doing!

粗暴美学/暴力美学
大数据,先考虑run it,然后才能知道规律在哪
「run it优先」能快速打通整体,洞察问题
「run it优先」能摆脱细节(繁枝末节)的束缚
「run it优先」能快速迭代出伟大的v1

不要只是看起来很努力,你需要追求一下看得见的效果。你自身所有的局限性都是可以通过大量的思考和努力而被解决的,这只是需要一些魄力而已。

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值