因为项目需要对一些中文名字的物品进行排序,我在C#控制台工程下面测试,直接使用系统的List.Sort()函数是可以自动进行排序。但是把同样的代码拷贝到Unity中排序就是错乱的了。
经过一番Google之后,最终猜测应该是下面这个原因。
对于C#控制台工程代码,系统采用的字符集应该是GB2312或者GBK,我在网上找了一个GB2312的字符集对应表http://ash.jp/code/cn/gb2312tbl.htm 发现汉字的编码是按照拼音的先后顺序排序的。而Unicode的字符集中的汉字是按照笔画和偏旁部首来进行排序的。
完整的Unicode中文字符集部分下载地址:
https://download.csdn.net/download/hongkenzhao/12883276
所以猜测,Unity中之所以用List.Sort()来进行排序中文名字出现错乱的问题,主要是因为Unity采用了Unicode字符集导致的。下图是Unity中字体选择字符集的选项。
有关字符集GB2312,GBK,Unicode等可以参考这篇文章:
炉石不传说:字符、字符集、字符编码的基础知识科普zhuanlan.zhihu.com解决方案一
思路:把Unicode字符集中的汉字的码值转换成GB2312或者GBK的码值,然后再对码值进行排序。
网上有解决方案是通过把Unicode的码值和GBK的码值通过一个数组建立起来索引关系。