wps可以查Unicode编码和GB2312,其中Unicode包含世界所有字符,GB2312不仅只对中文字符效率高些还不全。基于以上特性可以利用Unicode中有的字符来测试GB2312中不存在的字符,如“䶵”。
下面来解释我遇到的坑
使用大家喜闻乐见的“中"字,“中”的Uncode为4e2d(大小写不敏感,因为是两个2个B的编码)中的GB2312为d6d0。但是在wps中无论什么时候敲入d6d0都无法得到"中",无论你选的来自“Unicode(十六进制)”还是“简体中文 GB2312(十六进制)”,但是无论你选的来自“Unicode(十六进制)”还是“简体中文 GB2312(十六进制)”敲入4e2d都会得到"中",可见在敲编码得字符的方式中Unicode是相对于这两个编码的唯一入口,切换“简体中文 GB2312(十六进制)”只是为了得到GB2312编码。
插入-》符号-》下面的"其他符号"
那么有什么用呢?可以在unicode中找到一个生僻字,再切换到“简体中文 GB2312(十六进制)”,如果没有他的编码就找到了两者的异或值用于溢出测试如,编码失败时的返回值 ,同一字符在不同编码中的返回值等。
"䶵",unicode:4db5,在切换到“简体中文 GB2312(十六进制)”后是个空白,可见在GB2312字符集中没有这个字