数据库“写时模式”与“读时模式”对比

Lens5935

已于 2022-03-20 11:43:25 修改

阅读量4.6k

点赞数 2

分类专栏：数据库文章标签：数据库大数据 big data database

于 2022-03-19 17:12:10 首次发布

本文链接：https://blog.csdn.net/weixin_40983094/article/details/123593106

版权

29 篇文章

订阅专栏

作用于数据源到数据汇聚存储之间，典型使用就是传统数据库。数据不管是在入库还是采用装载外部数据或者将一个查询的输出结果写入数据库或者是使用UPDATE语句，数据库存储对于在数据写入数据库时都需要对schema进行检查控制，对照模式进行检查，如果在加载时发现数据不符合模式，则被拒绝加载数据。

作用于数据汇聚存储到数据查询分析之间，数据先存储，然后在需要查询分析的时候再为数据设置schema，底层存储不会在数据加载时进行验证，而是在查询数据时进行。

写时模式，会对存储的数据质量进行检查或檫除（ETL），确保数据在某个业务场景下明确定义的、精确的和可信的；
读时模式，因为数据没有受到严格的ETL和数据清理过程,也没有经过任何验证,该数据可能充斥着缺失或无效的数据,重复和一大堆其他问题，可能会导致不准确或不完整的查询结果。如果在on read的时候进行ETL，由于同样数据不同schema，则会导致重复工作。