提高你的Java代码质量吧:中文字符串排序的瑕疵

本文探讨了Java中中文字符串排序的问题,指出Arrays.sort()使用compareTo方法进行Unicode码值比较可能导致非预期结果。Java推荐使用Collator类进行正确的中文排序,但要注意汉字的特殊性和音形分离特性。对于更严格的排序需求,可以借助如pinyin4j等开源项目将汉字转为拼音来实现。
摘要由CSDN通过智能技术生成

一、分析 

在Java中一涉及中文处理就会冒出很多问题来,其中排序也是一个让人头疼的课题 

我们知道Arrays工具类的默认排序是通过数组元素的compareTo方法来进行比较的,那我们来看String类的compareTo方法的主要实现: 

while(k < lim){ 
    //原字符串的字符数组 
    char c1 = v1[k]; 
    //比较字符串的字符数组 
    char c2 = v2[k]; 
 
    if(c1 != c2){ 
        //比较两者的char值大小 
        return c1 - c2; 
    } 
    k++ 
} 

它是先取得字符数组,然后一个一个地比较大小,注意这里是字符比较(减号操作符),也就是UNICODE码值比较 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值