什么是流式数据分析

流式数据分析

互联网企业常常需要面对这样的需求,管理员需要了解服务器的负载、网络traffic、磁盘IO等等状态信息,决策人员需要实时地获知站点交易下单笔数、交易总金额、PV、UV等业务数据。这些都是源源不断产生的流式数据,并且需要给用户实时响应计算结果,对于这种场景来说,尽管MapReduce可以作一些实时性方面的改进,但仍很难稳定地满足需求。
流式数据的特征是数据会源源不断的从各个地方汇集过来,来源众多,格式复杂,数据量巨大,对于流式数据的处理,有这样的一种观点,即数据的价值将随着时间的流逝而降低,因此数据生成后最好能够尽快的进行处理,实时的响应计算结果,而非等到数据累积以后再定期地进行处理,这样,对应的数据处理工具必须具备高性能,实时性,分布式和易用性几个特征

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值