最近在看O’Reilly的《Fundamentals of Data Engineering》(《数据工程基础》),出版于2022年,好像没有中文译版,网上也没有找到太多的中文相关内容。
这段时间已经断断续续看了几章,有不少收获:
- 书中作者已经提到了一些比较新的理念,有种耳目一新的感觉
- 比如最近的GPT应用
- 比如big data已热度不如从前的说法
- 再结合上自己的工作内容,看作者写的对数仓、数开具体工作的描述和看法都很有共鸣
现开个帖子,记录本人的读书笔记。
之后也会做个b站的连载视频,更详细地介绍一下每一部分的内容。
1. Data Enginnering Described
1.1 What is Data Engineering?