HDFS是流式数据访问模式存储超大文件,在商用机硬件集群上运行
流式数据访问模式中,FSDataInputStream和FSDataOutputStream继承java.io.DataInputStream和java.io.DataOutputStream实现文件的读取和写入
Java接口读取数据
1) Hadoop URL读取数据
public class HdfsUrl {
/*
* 一个JVM只能调用一次,其他组件无法使用这种方法读取数据
*/
static {
URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
}
public static void main(String[] args) throws MalformedURLException, IOException {
InputStream in = null;
in = new U