DDIA
文章平均质量分 93
乾坤有思
coding虐我千百遍,我待coding如初恋
展开
-
DDIA读书笔记-第四章
其本质在于,Avro 的数据模式可以和数据存在一块,但是 ProtoBuf 的数据模式只能体现在生成的代码中,需要手动维护新旧版本备份数据与 PB 生成的代码间的映射。还有一种比较棘手的情况:在某个时刻,你给一个表增加了一个字段,较新的代码写入带有该字段的行,之后又被较旧的代码覆盖成缺少该字段的行。其中,向后兼容比较常见,因为时间总是向前流逝,版本总是升级,那么升级之后的代码总要处理历史积压的数据,自然会产生向后兼容的问题。但是对于数据,旧版本的代码写入的数据量,经年累月,可能很大。:新代码读取旧数据。原创 2023-10-12 10:29:10 · 116 阅读 · 0 评论 -
DDIA读书笔记-第三章
近年来提的较多的 HTAP 系统也是类似,其为了服务不同类型负载底层其实有两套不同的存储,只不过系统内部会自动的做数据的冗余和重新组织,对用户透明。如果行具有该值,该位为1,否则为0。传统关系型数据库是按行存储,但是这种分析的场景下,虽然只用到一个属性,也必须从磁盘上取出很多属性,成本太高,一个想法是按列进行存储,将每列中的所有值放在一起存储。此外,内存数据库还可以通过类似操作系统 swap 的方式,提供比物理机内存更大的存储空间,但由于其有更多数据库相关信息,可以将换入换出的粒度做的更细、性能做的更好。原创 2023-10-08 15:21:19 · 127 阅读 · 0 评论 -
DDIA读书笔记-第二章
如 Date 格式一样,可以把某个字段作为 JSON 格式,可以修改其中的某个字段,可以在其中某个字段建立索引。如果我们想找出在同一个学校和组织工作过的人,如果数据库不支持 Join,则需要在应用侧进行循环遍历来 Join。文档型数据库很擅长处理一对多的树形关系,却不擅长处理多对多的图形关系。当今最流行的关系模型:sql,基于关系模型,将数据组织成关系,在sql中称为表(Table),每个关系称为行(row)对于高度关联的数据集,使用文档型表达比较奇怪,使用关系型可以接受,使用图模型最自然。原创 2023-10-05 15:08:07 · 162 阅读 · 0 评论 -
DDIA读书笔记-第一章
的维护过程编写。原创 2023-10-03 18:10:18 · 139 阅读 · 0 评论