Storm

小东升职记

于 2018-12-17 19:55:01 发布

阅读量399

点赞数 2

分类专栏：新手必看 java Linux 编程规则小东升职记文章标签： storm

本文链接：https://blog.csdn.net/qq_38704184/article/details/85054407

版权

155 篇文章 1 订阅

订阅专栏

110 篇文章 0 订阅

订阅专栏

95 篇文章 0 订阅

订阅专栏

storm用来实时处理数据，特点：低延迟、高可用、分布式、可扩展、数据不丢失。

淘宝实时分析系统：实时分析用户的属性，并反馈给搜索引擎，最初，用户属性分析是通过每天在云梯上定时运行的MR job来完成的。为了满足实时性的要求，希望能够实时分析用户的行为日志，将最初的用户属性反馈给搜索引擎，能够为用户展示最贴近其当前需求的结果
携程网站性能监控：实时分析系统监控携程的网站的性能，利用HTML5提供的performance标准获得可用的指标，并记录日志。storm集群实时分析日志和入库。使用DRPC聚合成报表，通过历史数据对比等判断规则，触发预警事件。
阿里妈妈用户画像：实时计算用户的兴趣数据，为了更加精准投放广告，阿里妈妈后台计算引擎需要维护每个用户的兴趣点（理想状态是，你对什么感兴趣，就向你投放呢类广告）。用于兴趣主要基于用户的历史行为、用户的实时查询、用户的实时点击、用户的地理信息而得，其中实时查询、实时点击等用户行为都是实时数据。考虑到系统的实时性。阿里妈妈使用storm维护用户兴趣数据，并在此基础上进行受众定向的广告投放。

Nimbus:负责资源分配和任务调度；
Supervisor：负责接受nimbus分配的任务，启动和停止属于自己管理的worker进程。通过配置文件设置当前supervisor上启动多少个worker
worker：运行具体处理组件逻辑的进程。worker运行的任务类型只有两种，一种是spout任务，一种是Bolt任务。
Task：worker中每一个spout/blot的线程称为一个task。在storm0.8之后，task不在于物理线程对应，不同spout/bolt的task可能会共享一个物理线程，该线程称为executor

关注