Atlas元数据管理
什么是元数据?
元数据MetaData狭义的解释是用来描述数据的数据,广义的来看,除了业务逻辑直接读写处理的那些业务数据,所有其它用来维持整个系统运转所需的信息/数据都可以叫作元数据。比如数据表格的Schema信息,任务的血缘关系,用户和脚本/任务的权限映射关系信息等等。
为什么进行元数据管理?
对hive表的元数据用Atlas进行管理,就可以很清楚的知道表与表之前的血缘关系。一个表从哪几个表通过什么方式得来的,这些信息可以辅助我们问题追踪。方便工作交接,几千张表对于一个新员工来说是非常有压力的,但是有了元数据管理,就很方便新员工上手。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/93acbc9d58aeee3dbeda77b6ad9a8c13.png)