1.添加文件到缓存
job.addArchiveToClassPath(archive); // 缓存jar包到task运行节点的classpath中
job.addFileToClassPath(file); // 缓存普通文件到task运行节点的classpath中
job.addCacheArchive(uri); // 缓存压缩包文件到task运行节点的工作目录
job.addCacheFile(uri) // 缓存普通文件到task运行节点的工作目录
2.缓存文件的读取方式
URI[] cacheFiles = context.getCacheFiles();
Path cache = new Path(cacheFiles[0]);
System.out.println("分布式缓存路径"+cache.toUri().getPath());
分布式缓存路径/Users/apple/IdeaProjects/hadoop_etl/input/customer.txt
System.out.println("分布式缓存"+cacheFiles[0].getPath());
分布式缓存/Users/apple/IdeaProjects/hadoop_etl/input/customer.txt