大数据架构详解从数据获取到深度学习读书笔记

我们将大数据按处理时间的跨度要求可以分为以下几类:

1 基于实时数据流的数据处理(streaming Data processing),通常的是假跨度在数百毫秒到数秒之间


2 基于历史数据的交互式查询(Interactive Query),通常时间跨度数十秒到数分钟之间


3 复杂的批量数据处理(batch data Processing),通常的时间跨度在几分钟到数小时之间


算子:基本处理单元,负责完成对应的数据的转化

常见的算子:Group,Sort,Orderby,Window

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值