技术交流QQ群【JAVA,C++,Python,.NET,BigData,AI】:170933152
1.数据如果是连续不断产生的话,这样就是数据流的按年,比如,聊天的数据,是有一条发一条,
或者,用户点击商品的数据,都是连续不断的,不会攒着,攒10条一块发送,所以连续不断的
产生的数据,就是流式数据.
3.但是作为我们服务器的处理来说,他不是等着来一条就处理一条,这样太消耗资源了
一般都是来了数据就放那里,等数据攒到一定多的时候,再去处理数据.
4.高吞吐:要想实现高吞吐,就是必须要做分布式.
5.准确性还有容错性:数据本来在前面的,后来传输以后,就变成在后面了,要支持容错性
6.低延迟:作为spark streaming可以实现秒级别的延时操作.
7.但是flink可以做到的延时更低,可以实现毫秒级的低延时.
8.容错性:服务器挂了数据怎么办,我们要求挂了以后,我们可以回滚到一个可以接受的时点,然后继续处理.
开通了个人技术微信公众号:credream,有需要的朋友可以添加相互学习