Snowflake建造了一个更大，更简单的数据仓库

最新推荐文章于 2024-06-26 08:48:38 发布

仲培艺

最新推荐文章于 2024-06-26 08:48:38 发布

阅读量3.3k

点赞数

文章标签：数据仓库 Snowflake 云端

本文链接：https://blog.csdn.net/joy0921/article/details/80124471

版权

原文：Snowflake builds a bigger, simpler data warehouse
作者：Serdar Yegulalp 翻译：赖信涛责编：仲培艺

图片描述

基于云端的数据仓库系统Snowflake发布了新的feature，对企业来说更加强大，而且更加简单。

Snowflake由微软的前职员Bob Muglia建立，去年，他们将弹性仓库系统(Elastic Data Warehouse system)开源。这主要是为有分析需求，但是又想免去配置麻烦的用户准备的。

空间（以及速度和方便性）很重要

新的Snowflake坚持默认配置最高性能的原则——即不必用户或者Snoflake配置就可以达到最优化的效果。

其中一个新特性是多数据仓库功能，数据库可以自动从多个数据组聚合数据，来满足请求。如果多个用户发来相似的查询请求，查询结果可以缓存，然后重复使用，对性能进行优化。数据通过自动分享和分隔也大大加快了速度。

在Snowflake刚发布的时候，它并不做数据保护相关的东西。现在，除了自动在多个数据源之间同步数据之外，之前版本的数据也会自动保存一段时间，长短可以由用户设定。

要取回之前的数据，用户不需要存储或手动取回之前版本数据库的副本。它用的是一个特殊的SQL语法——SELECT AS OF--来得到一个之前版本的数据表。其他还有一些特殊的指令，例如CLONE和UNDELETE可以将之前版本的数据重建和重新存储。

黑盒操作

Snowflake的CEO Muglia在一次电话中指出，公司如何使用监控系统来实现“不干涉方法”。

“我们利用用户的查询，”他说。“我们不会看用户的数据，他们都被自动加密了。但是我们可合法提取其运行查询的信息。”这足够公司来持续提高算法和查询优化了。

这种系统的一个缺点是，它的查询和所有机件，相比于其它数据库平台是一个黑盒系统。这再次证明了Snowflake平台是一个专利——由客户产生的查询引擎。

Muglia的观点是，公司使用的系统可以让他们不断做出更新，来适应客户的查询请求。

“经常会有用户来找我们说，hey，你能告诉我这次查询出什么问题了吗？”Muglia说，“我们可以很快地向他们解释原因，然后做出反应，满足他们的需求。”

这些反馈反过来让Snowflake的迭代和优化非常迅速。

2016年8月12日-13日，由CSDN重磅打造的互联网应用架构实战峰会、运维技术与实战峰会将在成都举行，目前18位讲师和议题已全部确认。两场峰会大牛讲师来自阿里、腾讯、百度、京东、小米、乐视、聚美优品、YY互娱、华为、360等知名互联网公司，一线深度的实践，共同探讨高可用/高并发/高性能系统架构设计、电商架构、分布式架构、运维工具研发与实践、运维自动化系统的构建、DevOps、云上的运维案例分析、虚拟化技术、应用性能检测与管理、游戏行业的运维实践等，将和与会嘉宾共同探讨「构建更安全、更高性能、更稳定的架构和运维体系」等领域的话题与技术。【八折优惠中，点击这里抢票，欲购从速。】

仲培艺

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Snowflake建造了一个更大，更简单的数据仓库

原文：Snowflake builds a bigger, simpler data warehouse 作者：Serdar Yegulalp 翻译：赖信涛责编：仲培艺基于云端的数据仓库系统Snowflake发布了新的feature，对企业来说更加强大，而且更加简单。Snowflake由微软的前职员Bob Muglia建立，去年，他们将弹性仓库系统(Elastic Data War...
复制链接

扫一扫