Java 小心注释中由Unicode转义序列引发的错误
Java中的注释是否会引发错误呢?看下面这个注释:
// look inside C:\users
看起来似乎没什么问题,但实际上这个注释放在程序中会产生错误,以下面这段程序为例
public class Main {
public static void main(String[] args) {
// look inside c:\user
System.out.println("hello");
}
}
运行main方法会出现错误,下面是对应的报错信息
Error:(3, 27) java: 非法的 Unicode 转义
产生这种情况的原因是Java中的Unicode转义序列会在解析代码之前得到处理。举个例子:
String str = "\u0022+\u0022";
\u0022是转义序列\"
的Unicode值,所以str的值会是"+"
吗?实际上并不是,\u0022会在代码解析之前被转换成"
,所以str = ""+""
,也就是一个空串。
回到最初的问题,由于//look inside C:\users
这段注释中存在\u
,而其后并不是一个4位的十六进制数,因而程序在处理Unicode转义序列时出现了错误。
类似的情况:
// \u000A is a newline
上面的这个注释也存在问题,\u000A是转义序列\n
的Unicode值,在代码被解析之前,\u000A会被替换成一个换行符。
总而言之,在注释中出现\u
十分危险
参考资料:
[1] Cay S.Horstmann 著,林琪 苏钰涵等译.Java核心技术 卷1(原书第11版).北京:机械工业出版社,2020:32-33.