项目要用到汉字转拼音和五笔,拼音容易,使用pinyin4j.
五笔的话,搜索到的一个,似乎只有3000个左右汉字,恐怕不够.
查了下,xp下可以使用C:\Program Files\Windows NT\Accessories\Imegen.exe来逆转换码表.
在xp下安装王码五笔86版.安装完毕后,在system32下找到winwb86.MB文件进行逆转化.
生成初始的对照表后,去除不必要信息,然后写个小程序,去除词语,把汉字转化为16进制Unicode码,然后按照Unicode排序.
从4E00-9FA5,其中一些字没有五笔对照,而特殊的3007(汉字的圈圈0,〇)也没有.
结果在附件中: