从面试到入职,其实中间的过程还是没啥曲折的,offer发得快,毕业后顺理成章的进去了。开始以为做开发,写写spark代码啥的,要不然写写SQL也行…其实不然,啥活都干,就是不写代码!至今已有四月有余了……
你也许会好奇,做大数据开发竟然不写代码,是人性的扭曲,还是道德的沦丧。接下来将采用问答式手法,娓娓道来。
- 为什么需要写代码?
首先考虑需不需要写代码,大数据生态有很多现有的工具,当工具不满足使用时,才会开始写一些定制化的代码。这里的工具不满足需求,分两种情况,一种是工具真没有这功能,二是,有这个功能,但是比较复杂,用起来还不如我写代码来的快呢!你属于哪种?
- 为什么不要写代码?
你也许会产生疑问,当数据集成过来之后,数据的分析,比如打标签,画画像,对人做行为分析,这里不需要写代码吗,不会吧,不会吧?
首先,数据的集成,有可能需要写代码,也有可能不需要,比如用kettle、datax等,或者客户提供的同步工具(为了保证数据的保密性)。
接下来,数据的分析重中之重,如何给客户创造价值?就看你给客户圈的人群有没有质量