MySQL中utf8mb4字符集常见的排序规则

最新推荐文章于 2024-09-05 14:17:33 发布

huang_hai_an

最新推荐文章于 2024-09-05 14:17:33 发布

阅读量231

点赞数 5

文章标签： mysql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huang_hai_an/article/details/141926692

版权

MySQL中的utf8mb4字符集支持存储Unicode字符，包括emoji表情等4字节的字符。关于排序（collation），utf8mb4字符集提供了多种排序规则（collation），这些排序规则定义了字符如何比较和排序。不同的排序规则主要影响字符的比较方式，特别是在处理大小写、重音符号、以及特定语言字符的排序时。

常见的utf8mb4排序规则（collation）及其主要区别：

utf8mb4_unicode_ci

这是一个基于Unicode标准的排序规则，支持多种语言的字符排序。
ci表示大小写不敏感（case-insensitive），即比较时忽略大小写差异。
适用于需要支持多种语言且对大小写不敏感的场合。

utf8mb4_general_ci

这是一个较为通用的排序规则，也支持多种语言的字符排序。
同样，ci表示大小写不敏感。
与utf8mb4_unicode_ci相比，它在某些特定语言的字符排序上可能不如utf8mb4_unicode_ci准确，但通常性能稍好。

utf8mb4_bin

这是一个二进制排序规则，意味着它会根据字符的二进制值进行精确比较。
不区分大小写或重音符号，完全按照字符的二进制值排序。
适用于需要精确匹配字符（如密码存储）的场合。

utf8mb4_unicode_520_ci

这是基于Unicode 5.2.0标准的排序规则，与utf8mb4_unicode_ci类似，但基于更新的Unicode标准。
提供了对更多字符的准确排序支持。

utf8mb4_general_mysql500_ci

这是一个MySQL特有的排序规则，旨在与MySQL 5.0及之前版本的utf8_general_ci兼容。
提供了对utf8mb4字符集的支持，同时保持了与旧版本的兼容性。

utf8mb4_unicode_ci 与 utf8mb4_unicode_520_ci 之间的区别

主要区别在于它们基于的Unicode标准版本不同。utf8mb4_unicode_520_ci基于更新的Unicode标准，因此能更准确地处理新添加的字符和排序规则。
随着Unicode标准的更新，推荐使用基于最新标准的排序规则，如utf8mb4_unicode_520_ci（或更高版本，如果可用）。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
MySQL中utf8mb4字符集常见的排序规则

不同的排序规则主要影响字符的比较方式，特别是在处理大小写、重音符号、以及特定语言字符的排序时。utf8mb4_unicode_520_ci基于更新的Unicode标准，因此能更准确地处理新添加的字符和排序规则。随着Unicode标准的更新，推荐使用基于最新标准的排序规则，如utf8mb4_unicode_520_ci（或更高版本，如果可用）。这是基于Unicode 5.2.0标准的排序规则，与utf8mb4_unicode_ci类似，但基于更新的Unicode标准。提供了对更多字符的准确排序支持。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。