数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

最新推荐文章于 2023-03-18 12:34:59 发布

绿色滑板鞋

最新推荐文章于 2023-03-18 12:34:59 发布

阅读量149

点赞数

分类专栏：帆软故事会大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/licunlan0904/article/details/110181941

版权

大数据同时被 2 个专栏收录

40 篇文章 2 订阅

订阅专栏

帆软故事会

18 篇文章 1 订阅

订阅专栏

本文探讨了随着数据量增长，从数据库到数据仓库再到数据湖的发展过程。数据仓库用于数据分析和BI，而数据湖则保存原始数据以备不时之需。文章提到了BI、报表、数据仓库、ETL和大数据工程师等岗位，强调了他们在数据处理和分析中的角色和职责变化，指出随着技术发展，岗位要求也在不断提升。

摘要由CSDN通过智能技术生成

数据湖这个大坑，是怎么挖的？

数据在刚刚开始的时候，还是小体量，就好比创业公司，还不足够引起人们的注意。

但是当数据体量上来了，就好像变成了独角兽。

10个人去银行产生的数据，还能勉强搞定，但是成百上千个呢？甚至更多呢？你会说，银行有oracle这种强大的数据库啊，但是，传统数据库目前来说，只能做到处理、读写、删除一些需求，更多的还是存储数据的用途。

把这些数据聚合在一起分析，数据库做不到。

于是，人们在现有的数据库基础上，对数据进行加工，也就是常说的ETL：抽取、转换、加载。

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

然后，数据仓库就生成了，里面有各种不同的数据，分成不同的业务包，都是为了数据分析，用于BI和报表上面。

数仓这个概念吧，有了很久了，里面存了很多不同类型的数据，就好比是千万张Excel表格，都在这个仓库里，你要的时候可以查询。

可是时间长了，有人觉得数仓还不够，再造一个概念？我有时候不一定用得到现在的数据，需要过往的数据，怎么办？那就把所有数据汇集在一起，无论是excel还是word，先把这些数据和文件存在一起，等用的时候再说。

数据湖里，可能有如下的这些数据结构：

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

上面说了，为什么要有这些？都是为了报表和BI，更好地分析业务，给业务赋能。

就好比为什么要有python？说白了，不是减轻工作负担吗？有更快的开发方式为什么不用呢？

我由此想到了一些衍生的岗位：BI工程师，报表工程师，数据仓库工程师，ETL工程师，大数据工程师。

等等，为什么最后一个会出现？大数据和它们是一样的吗？打着大数据旗号，进去变成sql机器的也不是一两个了，哪怕你懂hadoop/hive/hbase，超复杂的sql谁都会写，时间问题罢了。

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

BI工程师，分为技术类的和非技术类的，非技术类的不会自己取数，老板要一个分析，BI工程师得求ETL工程师帮忙，老板急用，这才可以拿到要分析的数据，并不是仅仅会FineBI和Tableau这些工具就够了的。

做出图表和PPT没什么用，你还得对数据做出一定的解释，而且别人还得看懂，这都是你要做的，你可以理解为高级的数据分析师，但是既要懂业务，也能懂IT。

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

ETL工程师可不是只有取数这么简单，其实在未来，ETL工程师和数据仓库工程师做的事情，会越来越像，也就是大家所说的越来越“卷”，就好比5年前，产品经理只需要会画原型图就可以了，现在不一样了，加上了不少造概念，做分析的能力。

报表工程师和BI工程师，数据仓库应该是帮了他们的忙，数据都是结构化存储的，更加便于分析了，就拿报表工程师来说，复杂的sql取数基本上不需要了，如果企业的数据仓库做得好，那对报表的影响是显而易见的。

还有，现在都流行自动化了，也就是报表的数据实时更新，而不是原来的N+1（数据到明天才显示），再加上FineReport这样的报表扛把子工具（我只能这么形容），数据量大的时候，企业必须得用到报表工具。

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

就算是个人，FineReport做报表也比Excel强，如果你说你啥也不会，甚至连Excel都不会，那还是去用FineBI吧。

数据湖和数据仓库的建设，到底为了什么？由此产生的岗位区别在哪

大数据工程师我就不说了，这个岗位的概念太广了，其实应该细分出来。

绿色滑板鞋

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。