分析型数据仓库中读写分离的实现

最新推荐文章于 2023-10-10 14:44:43 发布

csdn研发技术

最新推荐文章于 2023-10-10 14:44:43 发布

阅读量8.1k

点赞数

分类专栏：技术文章文章标签：数据库工程师数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dev_csdn/article/details/78620885

版权

本文作者为神策数据（ID：SensorsDataCrop）资深研发工程师张广强，版权归神策数据所有。

和以 MySQL 为代表的传统事务型数据库相比，数据仓库有一个很大的特点，就是主要面向批量写和查询进行优化，可以不支持更新、事务这些高级特性。一些商用的数据仓库分析系统，例如 Vertica，已经可以做到千亿级数据的秒级导入和秒级查询。

神策数据一直致力于帮助企业搭建数据仓库，实现数据的秒级响应，积累数据资产。本文主要通过神策数据在技术上的探索与实践，探讨如何利用现有的开源组件实现分析型数据仓库当中的读写分离。

为什么要进行读写分离

分析性数据仓库一般有如下几个特点：

面临着复杂的多维分析需求，能够进行任意维度的上卷下钻；
存储的数据维度一般较多，所以是宽表，而且一般比较稀疏；
数据量比较大，一次写入，多次查询。

针对这样特点，分析性数据库一般选择列存储数据格式，例如 Parquet 等。优点是对于统计分析效率很高，而且对于稀疏的宽表具有很高的存储压缩比。所以我们可以认为列存储格式是一种面向读进行优化的存储格式，我们称为 ReadOptimized Store（ROS）。

但是列存储格式也有一个缺点：这种格式的数据一旦生成，就很难进行修改，也很难往已有的数据文件当中插入新数据，只能增加新的数据文件。像 MySQL 这种传统的数据库，使用的行存储文件格式是一种适合修改和插入的存储格式，我们可以认为这种行存储格式是面向写进行优化的存储格式，称为 Writ

最低0.47元/天解锁文章

csdn研发技术

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
分析型数据仓库中读写分离的实现

本文作者为神策数据（ID：SensorsDataCrop）资深研发工程师张广强，版权归神策数据所有。和以 MySQL 为代表的传统事务型数据库相比，数据仓库有一个很大的特点，就是主要面向批量写和查询进行优化，可以不支持更新、事务这些高级特性。一些商用的数据仓库分析系统，例如 Vertica，已经可以做到千亿级数据的秒级导入和秒级查询。神策数据一直致力于帮助企业搭建数据仓库，实现数据的秒级响应，积累
复制链接

扫一扫

专栏目录

csdn研发技术 CSDN认证博客专家 CSDN认证企业博客

码龄7年

90: 原创

30万+: 周排名

192万+: 总排名

193万+: 访问

: 等级

1万+: 积分

1380: 粉丝

773: 获赞

496: 评论

1157: 收藏

私信

关注

热门文章

分类专栏

技术文章 46篇
技术翻译 95篇
人物专访 4篇
大会 10篇

最新评论

程序员这个职业会是另一个即将破裂的泡沫？
frostjsy: 后面可能对理论知识要求、经验要求更高了吧
从开发小白到音视频专家
do ｛｝while；: 小老哥，我也刚入职你能不能不吝指导我一下
世界上第一个时序数据的Middle-Out算法压缩
lyh20021209: Big Head!
从开发小白到音视频专家
永存的大大咧咧: 我看这篇文章发的比较早，而恰巧近期参加七牛云的“一站式场景化智能视频云”的相关技术分享活动。所以在博主的楼下进行一些内容的补充和最新发展方向的探讨。 1. 成长的烦恼：在过去，我们可能更纠结的是使用什么语言，因为不同语言和系统的贴合程度是有缺别的；后来，不再局限于语言，因为大部分语言都实现了跨平台，所以我们更纠结的是如何基于平台的api做应用开发；而现在，我们更注重如何利用这些API开发一些「模组」，开发者可以利用这些「模组」，通过配置就可以实现一些功能，也是七牛现在着重在做的低代码音视频平台（low code）；而未来可能就真的是拖拉拽完成功能的开发。 2. 音视频开发包括哪些内容作者从「采集」->「渲染」->「处理」->「传输」介绍了主要的音视频方案。「采集」可能最开始的注重设备的参数（分辨率、帧率等），到现在随着iot采集设备的发展，可能更注重的是安全，这里面涉及一些边缘设备的通信协议以及加密算法。「渲染」一直是重中之重，加之近1年元宇宙的概念，又给渲染带来了无尽的难题，对于3D虚拟场景与现实场景的结合渲染技术可能是主要需要研究的方向。「处理」除了音频降噪，图片缩放等基础变化，对于音视频的处理可能更加的需要结合AI能力和场景，比如美颜，虚拟背景，会议实时字幕等等。「传输」17年没有5G吧，随着速率的提升我们的需求可能也在不断的变得苛刻，比如高清直播与实时互动。这里我还想补充的是「存储」，可能以前不会太过考虑这个问题，可能视频真的没有想象中那么多，虽然17年抖音已经非常火了，但是现在任何一个软件打开的视频流，以及我们随时随地的线上会议，还有各种各样的摄像头，让我们不得不重视起来存储，现在更重要的是肉眼画质不变的情况下，使图像体积变小，然后存储（七牛的kodo应该就可以）。最后谈一下“一站式”，对于音视频从采集、渲染、处理、到传输和存储，一站式的解决方案显得尤为重要，另外一站式就需要针对不同的场景去做智能化开发，这可能就是七牛「一站式场景化智能视频云」的真谛吧。
IDHub创始人曲明：数字身份将是下一个万亿市场
张京生 jim: 数字身份，万亿市场？不理解！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。