sort、sorted()都是参照字符的编码(Unicode)大小,进行排序的。汉字对应的编码顺序,本身就是杂乱的,所以使用sort排序结果自然无规则可言。
对少量的数据,可以理解为以汉字的首字母进行升序的。
解决思路:
首先要有自己的排序规则,比如按拼音字母,笔画多少。
然后再创建排序规则(可以是一个文本文件、也可以保存到数据库、也可以做个列表保存)。
最后用匿名函数配合sort就行排序。
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。