Storm整合Hdfs—从hdfs读取数据(二)

本文介绍了如何使用Storm从Hdfs连续读取文件夹内容,并在读取完成后退出Topology。通过GetHdfsBolt设置数据源,CountBolt统计手机号出现次数,实现了对文件的多次读取和有效控制。
摘要由CSDN通过智能技术生成

小厨上次写过一次利用Storm从hdfs读取数据,但是效果非常不好,例如只能读取一次文件,无法控制读文件的次数。如下图所示:::

因此,在这里,小厨利用第二种方法读取hdfs数据。

需求:1、可以连续的读整个文件夹下面的内容;2、读完最后一个文件之后,退出Topo

整个代码1:编写程序入口

package com.bigdata.storm;

import org.apache.storm.Config;
import org.apache.storm.LocalCluster;
import org.apache.storm.StormSubmitter;
import org.apache.storm.generated.AuthorizationException;
import org.apache.storm.generated.InvalidTopologyException;
import org.apache.storm.generated.StormTopology;
import org.apache.storm.thrift.TException;
import org.apache.storm.topology.TopologyBuilder;

/**
 * 描述一个topology对象  并向storm集群提交
 * @author xiaxing
 *
 */
public class TopoSubmitterClient {

	public static void main(String[] args) throws TException, InvalidTopologyException, AuthorizationException {
		
		//先获得一个Topology的构建器
		TopologyBuilder builder = new TopologyBuilder();
		
		//指定topo所有的spout组件类   
		//参数1  spout的id   参数2  spout的实例对象
		builder.setSpout("hdfs-spout", new GetHdfsBolt());
		
		//指定topo所用的第一个bolt组件,同时指定本bolt的消息流是从哪个组件流过来的
		builder.setBolt("countBolt", new CountBolt()).shuffleGrouping("hdfs-spout");
		
		
		//使用builder来生成一个Topology对象
		StormTopology phoneTopo = builder.createTopology();
		
		
		//将phoneTopo提交给集群运行
		Config config = new Config();
		//指定storm集群为Topology分配
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值