实时流计算框架-storm-关于grouping的理解
setBolt() setNumTasks() 方法有一个参数, 可以设置运行这个bolt的Task数量---线程数量. 那么grouping就是处理spout数据源分发给这些Task的策略.
这里例举3个比较常用的.
fieldGrouping, spout会把tuple发送给Bolt对应的Task,但是,要按照tuple的某个field来标识Task. 这样这个Task以后就只能收到field值为A的这个tuple, 这个理解起来略困难.举个例子.
需求: 按学号统计学生这个学期每次月考的各科..
原创
2020-09-29 17:44:06 ·
166 阅读 ·
0 评论