《大数据之路:阿里巴巴大数据实践》系列丛书
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
第14章 存储和成本管理
《大数据之路:阿里巴巴大数据实践》第14章探讨了存储和成本管理,包括数据压缩、数据重分布、存储治理优化、生命周期管理等策略。通过数据压缩,如使用archive方法,能有效节省存储空间。数据重分布则通过调整表的数据分布以优化存储。存储治理项优化通过元数据管理,推动数据存储优化。生命周期管理涉及各种策略,如定期删除、永久保留等,以平衡存储成本与业务需求。
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
第14章 存储和成本管理
246
1372
1042
1833
841

被折叠的 条评论
为什么被折叠?