MyEclipse或Eclipse软件编程通过API操作hadoop上的HDFS文件系统
1.导入HDFS的jar包
解压hadoop_2.6.0.tar.gz的安装包,
选中所有放在lib中的jar包,右键,buildpath
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2.新建类,然后开始编程
com.gaojunyu.hadoop.hdfs.test包中新建HdfsAPITest.java类
注意导入的包都是Hadoop的jar包
测试读本地文件系统文件(可以读取到)
LocalFileSystem是FileSystem的子类,这里拿到的是这个,所以暂时只能读本地的文件系统呢!
两种方法读取HDFS上的文件
第一种: FileSystem fs = FileSystem.get(new URI("hdfs://192.168.177.130:9000"), conf); //这个URI参照core-site.xml
第二种:把core-site.xml文件从集群中拷贝出来,放到项目的src目录下
要注意,core-site.xml文件的配置,如下图,要么做IP与主机名的映射,要么干脆就直接写IP
下面是做到这里的所有代码,已经优化,改过了!