【MySQL】 字符集排序规则(字符集校验规则)命名格式

本文详细解释了UTF-8MB4字符集中各种排序规则命名的结构,包括字符集、编码、语言、重音、大小写敏感性和二进制比较选项,以及不同规则针对多语言环境的适用性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

排序规则命名格式

字符集_[编码|语言][_重音][_大小写敏感][_bin]
utf8mb4 字符集的默认校验规则为: utf8mb4_0900_ai_ci

格式中各部分含义

  • 字符集: utf8mb4 、gb2312 等
  • 编码:可选,值可能为 0900、unicode 或 unicode_520
  • 语言:可选,表示校验规则为特别语言而定制,如 _zh 表示适用于中文,_da 表示适用于丹麦语
  • 重音:可选,ai 表示不区分重音,as 表示区分重音
  • 大小写敏感:可选, ci 表示不区分大小写,cs 表示区分大小写
  • bin: 可选,指字符比较时采用二进制进行比较。 当将字符串视为二进制进行比较时,会将字符串中的每个字符视为一组字节(或比特)的序列,而不考虑字符的语义、语言、大小写或重音符号等特征。在进行二进制比较时,只比较字符的字节表示,而不考虑字符本身的含义。

示例

以 utf8mb4 所有字符集为例

<
校验规则 描述
utf8mb4_0900_ai_ci 基于Unicode 9.0.0版本,不区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_as_ci 基于Unicode 9.0.0版本,不区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_as_cs 基于Unicode 9.0.0版本,区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_bin 基于Unicode 9.0.0版本,进行严格的二进制比较和排序,区分大小写和字符编码。
utf8mb4_bin 进行严格的二进制比较和排序,区分大小写和字符编码。
utf8mb4_croatian_ci 不区分大小写,适用于克罗地亚语的比较和排序。
utf8mb4_cs_0900_ai_ci 基于Unicode 9.0.0版本,不区分大小写,适用于捷克语的比较和排序。
utf8mb4_cs_0900_as_cs 基于Unicode 9.0.0版本,区分大小写,适用于捷克语的比较和排序。
utf8mb4_czech_ci 不区分大小写,适用于捷克语的比较和排序。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值