一、分析
在Java中一涉及中文处理就会冒出很多问题来,其中排序也是一个让人头疼的课题。
我们知道Arrays工具类的默认排序是通过数组元素的compareTo方法来进行比较的,那我们来看String类的compareTo方法的主要实现:
while(k < lim){
//原字符串的字符数组
char c1 = v1[k];
//比较字符串的字符数组
char c2 = v2[k];
if(c1 != c2){
//比较两者的char值大小
return c1 - c2;
}
k++
}
它是先取得字符数组,然后一个一个地比较大小,注意这里是字符比较(减号操作符),也就是UNICODE码值比较。
Java中文字符串排序:从compareTo到Collator

本文探讨了Java中中文字符串排序的问题,指出Arrays.sort()使用compareTo方法进行Unicode码值比较可能导致非预期结果。Java推荐使用Collator类进行正确的中文排序,但要注意汉字的特殊性和音形分离特性。对于更严格的排序需求,可以借助如pinyin4j等开源项目将汉字转为拼音来实现。
最低0.47元/天 解锁文章
9600

被折叠的 条评论
为什么被折叠?



