如何比较字形相同但编码不同的两个字

咖啡煮码

于 2024-03-05 16:30:14 发布

阅读量553

点赞数 5

分类专栏：杂谈文章标签： java 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37557894/article/details/136479821

版权

杂谈专栏收录该内容

7 篇文章

订阅专栏

今天在做字符串比较时遇到个很新奇的问题，在此记录一下。

字符串比较最常用的方法就是equals方法，来看一下下面这个比较会返回什么结果呢？

public static void main(String[] args) {
    {
        String s1 = "⽹"; // 12153
        String s2 = "网"; // 32593
        boolean result = s1.equals(s2);
        System.out.println(result);
    }

    {
        String s1 = "⽺"; // 12154
        String s2 = "羊"; // 32650
        boolean result = s1.equals(s2);
        System.out.println(result);
    }
}

你第一眼看到这段代码可能会想 “这作者该不会是个傻子吧？”，😂

但是，两个result结果又确实都是false。

Java的String对象中char字符的编码格式为UTF-16。debug看一下这几个字的UTF-16的值

看看，看着长的一样的字，UTF-16的值却不同，确实不是同一个字符吧

这是什么情况呢？网上搜了一通，大概是什么“兼容表意文字区”与“统一表意文字区”的区别，我对文字编码了解不深，感兴趣的自己去研究吧。

那产品经理看到该说了：“这两个字明明长的一样，你总不能告诉用户说这俩字不是同一个字吧？你用技术手段处理下，让他们做比较时认为是同一个字”

我说：“xxxxxxxxx……没问题”，只不过需要一个方法来将字符串提前处理一下，这个方法是jdk自带的：

这是加上转换的代码

public static void main(String[] args) {
    {
        String s1 = "⽹"; // 12153
        String s2 = "网"; // 32593
        s1 =  Normalizer.normalize(s1,Normalizer.Form.NFC);
        s2 =  Normalizer.normalize(s2,Normalizer.Form.NFC);
        boolean result = s1.equals(s2);
        System.out.println(result);
    }

    {
        String s1 = "⽺"; // 12154
        String s2 = "羊"; // 32650
        s1 =  Normalizer.normalize(s1,Normalizer.Form.NFC);
        s2 =  Normalizer.normalize(s2,Normalizer.Form.NFC);
        boolean result = s1.equals(s2);
        System.out.println(result);
    }
}

debug一下看看转换后的结果

转换了一道后，值一样了，再次使用 equals 就返回 true 了，大功告成。

博客等级

码龄8年

49
原创

710
点赞

719
收藏

532
粉丝

关注

私信

热门文章

分类专栏

网络协议 12篇
JAVA 3篇
Redis 3篇
Tomcat 16篇
Spring 2篇
Dubbo 2篇
杂谈 7篇
计算机组成原理 5篇

最新评论

深入剖析Tomcat(四) 剖析Tomcat的默认连接器
2301_79527292: 楼主你好，这段如何解释？那么标号为2的这一对是干啥用的呢？我理解的是：预防连接器在assign方法中执行完notifyAll又释放锁后，不知怎么着马上又执行到了同一个处理器的assign方法，并且先于该处理器线程获取到锁，这时候处理器线程还没有取走上一个socket请求呢，所以得等待处理器线程取走上一个socket。处理器线程取走socket后，notifyAll()通知连接器线程：你可以继续了，然后连接器线程结束等待，继续执行。不知怎么着这种解释略显牵强。望赐教。
HTTP请求的流转路径，从Tomcat到SpringMVC
咖啡煮码: 感谢认可继续努力
HTTP请求的流转路径，从Tomcat到SpringMVC
Kwan的解忧杂货铺@新空间: 博主的文章给了我很多新的视角，知识点全面，读完总是充满启发，继续前进吧！博客内容详实，每一次阅读都是一次启发，希望你的努力会有更多人认可。
Java Socket通信编程
CSDN-Ada助手: 恭喜作者能够持续创作，第20篇博客“Java Socket通信编程”内容丰富，让读者受益匪浅。希望作者在未来的创作中，能够继续分享更多关于Java编程的知识，比如常见的网络编程技巧或者实用的开发案例，让读者能够更好地掌握相关技术。期待作者的下一篇作品！
Mysql datetime 精度缺失问题
CSDN-Ada助手: 非常感谢您分享关于"Mysql datetime 精度缺失问题"的博客！恭喜您已经写了第19篇博客，这是一项了不起的成就。您在博客中提到的Mysql datetime精度缺失问题非常有价值，对于使用Mysql的开发者来说是一个重要的问题。您的解析和观点非常有见地，让我对这个问题有了更深入的了解。希望您能继续保持创作的热情和努力，继续分享您的知识和经验。我的建议是，您可以考虑深入探讨Mysql中其他可能存在的精度问题，或者分享一些解决这类问题的实用技巧。您的经验和见解将对更多的读者有所帮助。再次恭喜您的成就，期待您的下一篇博客！谢谢您的分享。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。