模型较为简单:
线性结构:GetTweeters—————GetFollowers————PartialUniquer—————CountAggregator
以上全部为bolt节点,最开始由drpc.execute("reach", url)发起
此处有疑问1:
两处fieldsGrouping中的new Fields中不管是仅写“id”还是如图红圈部分一样写上上一个declareOutputFields中定义的declare,都有效果,参考途中红框上面注释的部分。
不知道是怎么判定的。
节点分析:
GetTweeters:
GetFollowers:
PartialUniquer:
CountAggregator:
最后一个bolt:CountAggregator在多并行度(执行器 Executor)的时候才有意义。即结构中被注释掉的那段代码。