大数据整合方案架构总结

说明

本文着重于针对数据整合案例进行学习总结描述,选取部分数据ETL及平台应用中面临的问题及经验进行介绍,未对完整平台功能及流程进行展开描述。以下总结均来源于自身过往经验。特别的,融合数据安全模块及DaaS服务建议进行简要描述。

需求分析

  1. 数据量:亿级
  2. 数据格式:以RDBMS数据及log数据为例
  3. 数据来源:RDBMS,服务器
  4. 传输要求:以离线为例
  5. 存储平台:基于Hadoop技术栈部署
  6. 数据安全:按公司内部标准构建

方案架构

方案架构图

如图为融入数据安全管理及DaaS服务的整合架构图(南北向架构),其中黑色实线部分为大数据平台范围。

针对海量日志数据部署建议:

  • 构建全流程统一数据模型
  • 采用边缘SDK或者节点服务器进行计算
  • 先经过实时数据缓存区,HBASE/SNAPPYDATA
  • 历史数据通过dumper沉淀,建立索引
  • 使用dremio、Presto、Impala、Clickhou
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值