jstorm 是阿里巴巴开源的基于storm采用Java重写的一套分布式实时流计算框架,使用简单,特点如下:
开发非常迅速: 接口简单,容易上手,只要遵守Topology,Spout, Bolt的编程规范即可开发出一个扩展性极好的应用,底层rpc,worker之间冗余,数据分流之类的动作完全不用考虑。
扩展性极好:当一级处理单元速度,直接配置一下并发数,即可线性扩展性能
健壮:当worker失效或机器出现故障时, 自动分配新的worker替换失效worker
数据准确性: 可以采用Acker机制,保证数据不丢失。 如果对精度有更多一步要求,采用事务机制,保证数据准确。
优点:
Nimbus 实现HA
彻底解决Storm雪崩问题:底层RPC采用netty + disruptor保证发送速度和接受速度是匹配的
新增supervisor、Supervisor shutdown时、提交新任务,worker数不够时,均不自动触发任务rebalance
新topology不影响现有任务,新任务无需去抢占老任务的cpu,memory,disk和net
减少对ZK的访问量:去掉大量无用的watch;task的心跳时间延长一倍;Task心跳检测无需全ZK扫描
Worke
java-jstorm
最新推荐文章于 2021-05-19 10:32:48 发布
JStorm是阿里巴巴基于Storm用Java重写的一个分布式实时流计算框架,其特点是开发快速、扩展性强、健壮且保证数据准确性。文章介绍了JStorm的主要优点,如Nimbus的高可用性,解决Storm的雪崩问题,减少对Zookeeper的访问等。此外,还阐述了JStorm任务的简单编程模型,以及如何遵循Spout和Bolt规范进行开发。在安装部分,提到了参考其他博客进行详细操作。
摘要由CSDN通过智能技术生成