此时注意两种文件路径表示形式,一个在HDFS中。一一个是本地文件系统
DistributedCache.getLocalCacheFiles (job) 返回的是:/home/hadoop/In
然而:HDFS:hdfs://home/hadoop/In
本地: file://home/hadoop/In
此时如果你想在HDFS获取数据,同时直接使用DistributedCache.getLocalCacheFiles (job)的路径。
则会发生在本地系统查找文件的情况,则就会报FileNotFoundException
解决方法:file:// + DistributedCache.getLocalCacheFiles (job)