数据平台架构基于AWS的使用总结- Redshift优劣

最新推荐文章于 2024-10-12 09:26:14 发布

Tony_老七

最新推荐文章于 2024-10-12 09:26:14 发布

阅读量5.2k

点赞数 1

分类专栏： AWS 文章标签：数据平台 redshift 架构数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tonylee0329/article/details/50511025

版权

本文总结了AWS Redshift作为数据仓库服务的优点，如快速部署、高性能和稳定性，同时也指出其在中国区未开放、网络传输问题以及与ETL的配合中可能存在的挑战。建议在早期阶段使用Redshift快速搭建数据平台，聚焦数据分析。

摘要由CSDN通过智能技术生成

AWS Redshift优劣使用总结

标签（空格分隔）： Blog

AWS的数据仓库服务-Redshift，可以比较快速方便地实现数据仓库的基础模块，我们的数据仓库目前就是基于Redshift。

Why Redshift

可以快速地实现cluster存储，基本零运维
性能高、稳定性强(这一点可以查看参考链接1)

虽然是2014-02的数据，但是基本的情况足以说明，redshift在Scan、Aggregation、Join等各方面都表现出非常优越的领先优势。
而且目前的redshift也已经增加了对自定义函数(UDF)的支持，相信能够满足更多人的选择.
当时我们的日志解析模块使用EMR，结果存储在S3，很天然地选择Redshift来作为后续的存储和计算。
整个集群会做镜像，可以实现快速恢复及集群拷贝.

以上更多是我们的选择考虑，下面来聊一聊觉得需要考虑的不好的地方：

Trade Offs

目前Redshift在中国区并未开放，包括挺多其他大数据相关服务。我们目前服务在新加坡节点
GFW的跨网络问题

我们的服务器是在国内，这个就必须谈到跨data
center的数据传输问题，类似的一个chain：中国区数据打包-> 上传新加坡节点的S3 -> 从S3 upload到新加坡节点的Redshift。
这个过程中遇到挺多网络的问题

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。