【总结】Amazon Kinesis实时数据分析最佳实践分享

本文分享了Amazon Kinesis在大数据实时分析处理中的最佳实践,涵盖了数据流处理的挑战、Kinesis的工作流程以及与Storm的对比。通过Kinesis,可以实现从数据采集到分析的无缝对接,尤其在广告、电商和社交网络等领域有广泛应用。Kinesis提供了易用的API,支持与S3、Redshift等AWS服务集成,确保数据可靠性并允许动态扩展处理能力。
摘要由CSDN通过智能技术生成

1.邱洋总结

  • AWS的服务全部采用SOA架构可以需要时相互调用
  • 关于大数据的实时流处理,AWS提供了传统方案和完全host方案
    • 传统方案是EC2上面部署flume (采集)、kafka(数据转存)、storam(流处理)
    • 完全host方案是Kinesis
  • 使用Kinesis还是需要用户通过API来将手机、网站点击、IoT、传感器等各类数据源的数据接入
  • 允许用户编写Kinesis的Worker来处理自定义的数据处理逻辑(扩展性)
  • Kinesis处理之后的数据,AWS建议存储S3或redshift等存储中,后续使用
  • Kinesis的典型用法是:前端数据源→kinesis流处理→S3保存临时数据→EMR数据处理→redshift做BI分析。整体使用CW来做运行监控,并且可以出发AutoScaling来弹性伸缩处理能力

图16

  • Kinesis实时数据流的应用场景
    • 对于广告平台:用户在互联网上的行为,能实时的影响广告推送内容,在用户下一次刷新页面时,就提供给用户新广告
    • 对于电商:用户的每一次收藏、点击、购买行为,都能被快速的归入他的个人模型中,立即修正商品推荐
    • 对于社交网络:用户社交图谱变更和发言行为,也能快速反映在他的好友推荐、热门话题提醒上

2.概述

2.1.AWS基于云的完整大数据服务

  • 采集:实时数据流采集处理(Kinesis)
  • 保存:大规模存储
    • DynonamoDB
    • S3
    • Glacier
  • 处理:大集群并行计算
    • EMR
    • EC2
    • Redshift–MPP数据库
    • Data Pipeline–ETL工具

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值