【MySQL】utf8mb4_unicode_ci、utf8mb4_general_ci的区别

【自我简介】

以下三者都存在于MYSQL数据库的字符集排序规则中;

  • utf8mb4_general_ci : 不区分大小写, utf8mb4_general_cs 区分大小写
  • utf8mb4_bin : 将字符串每个字符串用二进制数据编译存储,区分大小写,而且可以存二进制的内容。
  • utf8mb4_unicode_ci : 校对规则仅部分支持Unicode校对规则算法,一些字符还是不能支持;utf8mb4_unicode_ci不能完全支持组合的记号。

【自我阐述】

  • ci 是 case insensitive, 即 “大小写不敏感”, a 和 A 会在字符判断中会被当做一样的。
  • bin 是二进制, a 和 A 会别区别对待。(例如你运行:SELECT * FROM table WHERE txt = ‘a’, 那么在utf8mb4_bin中你就找不到 txt = ‘A’ 的那一行, 而 utf8mb4_general_ci 则可以。)
  • utf8mb4_general_ci 是一个遗留的校对规则,不支持扩展,它仅能够在字符之间进行逐个比较。这意味着utf8mb4_general_ci校对规则进行的比较速度很快,但是与使用 utf8mb4_unicode_ci的校对规则相比,比较正确性较差。

【自我缺点】

对于一种语言仅当使用 utf8mb4_unicode_ci 排序做的不好时,才执行与具体语言相关的utf8mb4字符集校对规则。例如,对于德语和法语,utf8mb4_unicode_ci工作的很好,因此不再需要为这两种语言创建特殊的utf8mb4校对规则。

utf8mb4_general_ci 也适用德语、法语或者俄语,但会有不准。如果你的应用能够接受这些,那么应该使用 utf8mb4_general_ci,因为它速度快。否则,使用utf8mb4_unicode_ci,因为它比较准确。

【自我推荐】

utf8mb4_unicode_ci比较准确,utf8mb4_general_ci速度比较快。通常情况下,新建数据库时一般选用 utf8mb4_general_ci 就足够了!

### UTF8MB4_UNICODE_CIUTF8MB4_GENERAL_CI 的差异 在 MySQL 中,`utf8mb4_unicode_ci` 和 `utf8mb4_general_ci` 是两种不同的排序规则(collation),用于处理字符集 `utf8mb4` 下字符串的比较和排序。 #### 字符串比较准确性 `utf8mb4_unicode_ci` 排序规则基于 Unicode 标准实现更严格的语言敏感性。这种排序方式考虑到了更多复杂的语言特性,如重音符号、变音符号和其他特殊字符的区别[^1]。因此,在多语言环境中特别是对于欧洲语言的支持更为精准。 相比之下,`utf8mb4_general_ci` 则采用了较为宽松的方式来进行字符匹配与排序操作。它忽略了某些细节上的差别,比如不同形式的字母可能被视为相同对待;这使得其性能通常优于前者但在特定情况下可能会丢失一些细微的语言特征[^2]。 #### 性能表现 由于 `utf8mb4_unicode_ci` 需要执行更加细致入微的文字分析工作来确保正确无误地识别各种文字形态及其含义关联,所以在实际应用过程中往往伴随着更高的计算成本以及相对较慢的速度体验。而另一方面,`utf8mb4_general_ci` 因为其简化了部分逻辑判断流程从而获得了更好的效率优势[^3]。 ```sql SELECT 'é' = 'e' COLLATE utf8mb4_unicode_ci AS unicode_result, 'é' = 'e' COLLATE utf8mb4_general_ci AS general_result; ``` 上述 SQL 查询展示了两个排序规则下对带重音符号的小写字母 "é" 与普通小写英文字母 "e" 进行相等性测试的结果对比情况: - 使用 `utf8mb4_unicode_ci` 返回 false 表明两者并不认为是相同的; - 而采用 `utf8mb4_general_ci` 则会返回 true 认定它们可以互换使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Itfuture03

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值