在使用Java HDF5库时,发现无法打开UTF-8文件名(路径名)的HDF5文件。因此打开HDF5之前需要判断文件的全路径名是否全为Latin-1(ISO-8859-1)字符,若不是,则把HDF5文件复制为路径名全是Latin-1(ISO-8859-1)字符的临时文件,在临时文件上做处理,处理完再把临时文件复制到原文件,最后删除临时文件。
Java判断字符串是否全为Latin-1(ISO-8859-1)字符,有以下两个简单方法:
private static boolean isLatin(final String str) {
try {
return str.equals(new String(str.getBytes("ISO-8859-1"), "ISO-8859-1"));
} catch (final UnsupportedEncodingException e) {
return false;
}
}
和
private static boolean isLatin2(final String str) {
return Charset.forName("ISO-8859-1").newEncoder().canEncode(str);
}
通过对一个字符串进行一百万次的测试,发现第一个方法耗时2.5秒,第二个方法耗时15.5秒,两者差距不小。