MySQL 字符集 排序规则

1、字符集

  1. utf8mb4:UTF-8 的变种,最常用的字符集之一,支持包括 Emoji 表情在内的大部分 Unicode 字符。
  2. utf8:也是 UTF-8 的变种,但只支持 Unicode 字符集中的基本多语言平面(BMP)字符,不支持一些特殊字符,如 Emoji。
  3. latin1:也被称为 ISO 8859-1,西欧字符集,包括常用的拉丁字母、数字和标点符号。
  4. gbk:简体中文字符集,兼容 GB2312 和 GBK 编码,支持汉字和一些日韩文字符。
  5. utf16:UTF-16 编码,使用双字节来编码 Unicode 字符,可以支持更广泛的 Unicode 字符集。
  6. utf32:UTF-32 编码,使用固定的 4 字节来编码所有 Unicode 字符,包括辅助平面字符。

通常情况下,一般推荐使用 utf8mb4 字符集,因为它广泛支持大部分 Unicode 字符,并且适用于多种语言环境。utf8mb4 是 MySQL 5.5.3 版本及以上的默认字符集,它可以满足大多数应用的需求。

2、排序说明

  1. utf8mb4_general_ci:utf8mb4 字符集的默认排序规则,不区分大小写,对各种语言的排序都较为准确。
  2. utf8mb4_unicode_ci:基于 Unicode 标准的排序规则,不区分大小写,可以正确地排序各种语言和特殊字符。
  3. utf8_general_ci:utf8 字符集的默认排序规则,不区分大小写,对一些语言排序效果较好,但对一些特殊字符的排序可能不准确。
  4. utf8_unicode_ci:基于 Unicode 标准的排序规则,不区分大小写,适用于各种语言和特殊字符。
  5. latin1_swedish_ci:latin1 字符集的默认排序规则,不区分大小写,适用于西欧语言。
  6. latin1_general_ci:latin1 字符集的通用排序规则,不区分大小写,也可用于西欧语言。
  7. binary:二进制排序规则,区分大小写,按照字符的二进制值进行排序。

如果应用需要正确地排序各种语言、特殊字符或者多语言混合的数据。一般推荐使用 utf8mb4_general_ci或 utf8mb4_unicode_ci 排序规则,能够满足大部分排序需求。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值