数据时代的今夕,如秋风席卷落叶漫天纷飞,storm愿做系铃人解之庖丁。
一、是什么
Storm是一个分布式的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务。Storm集群的输入流由一个被称作spout的组件管理,spout把数据传递给bolt, bolt把数据保存到某种存储器或者把数据传递给其它的bolt。二、有什么特性
1)简化编程,从零开始实现实时处理,使用Storm复杂性降低;
2)容错性,Storm集群会关注工作节点状态,如果宕机了必要的时候会重新分配任务;
3)可扩展性,集群扩展时增加机器,Storm可以在新机器就绪时分配任务;
4)可靠性+快速,Storm设计的一个显著特点是快速,同时可靠所有消息都可保证至少处理一次,如果出错消息可能处理不只一次,不过不会丢失消息;
5)事务性,具有很好的事务性等。
三、应用场景
日异月新的今天,对数据的实时处理要求越高,storm的应用随之流行。如推荐系统、广告投放数据回收……