在用java中的类加载器获取配置的XML文件的路径时,如果路径存在中文会导致系统读取文件失败。报错:系统找不到指定的路径
发生错误的代码如下:
/根据类加载器获取student.xml的路径
String path = jsoupDemon01.class.getClassLoader().getResource("student.xml").getPath();
Document document = Jsoup.parse(new File(path), "utf-8");
Elements name = document.getElementsByTag("name");
System.out.println(name);
在这里,因为我的“student.xml”目录下存在中文路径,因此在下一步新建文件对象时会抛出FileNotFoundException找不到文件。
经查阅资料得知,TestURL().class.getResource("").getPath()或TestURL().class.getResource("").getFile()获得的路径,不能被FileReader()和FileWriter()直接应用。
原因是URL对空格,特殊字符(%,#,[]等)和中文进行了编码处理。
例如:空格变为%20。
解决方法(1),使用repaceAll("%20",' ')替换后,只能解决空格问题。但是路径中包含%和中文就不行了。
解决方法(2),使用URLDecoder.decode(str,"UTF-8")解码,但是只能解决一部分,若路径中含有+,也是不能解决的,原因是URL并不是完全用URLEncoder.encode(str,"UTF-8")编码的,+号被解码后,却变成了空格。
解决方法(3),可以解决所有的问题,用TestURL().class.getResource("").toURI().getPath(),但是需要处理URISyntaxException异常,比较麻烦点。
在这里,根据方法二,我加了一段代码:
path = java.net.URLDecoder.decode(path,"utf-8");
如下:
String path = jsoupDemon01.class.getClassLoader().getResource("student.xml").getPath();
path = java.net.URLDecoder.decode(path,"utf-8");
Document document = Jsoup.parse(new File(path), "utf-8");
Elements name = document.getElementsByTag("name");
System.out.println(name);
问题成功解决。