![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
BigData
丁郁非
这个作者很懒,什么都没留下…
展开
-
布隆过滤器
在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元素存在计算机中,遇到一个新元素时,将它和集合中的元素直接比较即可。一般来讲,计算机中的集合是用哈希表(hash...翻译 2019-06-25 09:11:46 · 104 阅读 · 0 评论 -
[转]Apache Storm
Apache Storm背景介绍流计算:将大规模流动数据在不断变化的运动过程中实现数据的实时分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。主流流计算框架:Kafka Streaming、Apache Storm、Spark Streaming、Flink DataStream等。Kafka Streaming:是一套基于Kafka-Streaming...转载 2019-06-25 09:28:31 · 177 阅读 · 0 评论 -
Apache Strom
Apache StormStorm是什么?Storm是免费开源的分布式实时计算系统,改系统在2.0.0之前改架构核心实现使用Clojure编程实现,在本次版本以后Storm底层实现做了重大的调整使用Java8重构了Storm。Storm是一个实时的流处理引擎,能实现对记录的亚秒级的延迟处理。Storm在 realtime analytics、online machine learning、co...转载 2019-06-21 21:10:22 · 311 阅读 · 0 评论