大数据-224 离线数仓 - 数仓 技术选型 版本选型 系统逻辑架构 数据库命名规范
以上估算的生产环境,实际上除了生产环境以外,还需要开发测试环境,这也需要一定数量的机器。Apache或第三方发行版(CDH、HDP、Fusion Insight)如何确认集群规模(假设:每台服务器20T硬盘,128GB内存)框架,软件尽量不要选择最新的版本,选择半年前左右的稳定版本。可以从计算能力、CPU、内存、存储量等方面考虑集群规模。要分析的数据有两部分:日志数据+业务数据。其他未考虑的因素:数据压缩、业务数据。这种情况下,需要多大的集群规模?(备注:本项目未使用)
原创
2024-12-02 00:17:06 ·
603 阅读 ·
0 评论