GB2312是基本的汉字编码集,通过GB2312编码表里的汉字编码规则,生成随机的汉字编码,再通过Encoding类进行转换,可以达到生成随机汉字的目的。
GB2312的汉字编码由区域码和位置码两部分组成,如汉字“好”的十六进制区域码是ba,十六进制位置码是c3
从GB2312编码表中可以观察到汉字都从第16区B0开始,并且从区位D7开始以后的汉字都是和很难见到的繁杂汉字,所以随机生成的汉字十六进制区位码第1位范围在B、C、D之间,并且如果第1位是D的话,第2位区位码就不能是7以后的十六进制数。
在位置码方面,通过GB2312编码表可以发现每区的第一个位置和最后一个位置都是空的,没有汉字,因此随机生成的区位码第3位如果是A的话,第4位就不能是0,第3位如果是F的话,第4位就不能是F。
参考资料:
GB2312简体中文编码表
http://www.onejava.com/article/gb2312.htm
用C#生成随机中文汉字验证码的基本原理
http://www.codesky.net/article/doc/200804/2008041882518155.htm