uft8和utf8mb4的区别

本文详细介绍了Unicode字符集、UTF-8编码、utf8mb3和utf8mb4的区别,重点强调了utf8mb4在支持更多字符,如生僻字和emoji方面的优势,以及在MySQL/MariaDB中使用utf8mb4的建议。
摘要由CSDN通过智能技术生成

1、Unicode字符集

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求

2、UTF-8 编码

UTF-8是Unicode的实现方式之一
UTF指的是:Unicode Transfer Format,即Unicode传输编码。
UTF-8是一种变长的编码方法,字符长度从1个字节到4个字节不等

一个utf8数字占1个字节
一个utf8英文字母占1个字节
少数是汉字每个占用3个字节,多数占用4个字节

3、utf8mb3 字符集

utf8mb3 :阉割过的 utf8 字符集,只使用1~3个字节表示字符

在当前主流版本的MySQL / MariaDB中,使用utf8作为字符集时,默认表示的是utf8mb3。

4、utf8mb4 字符集

MySQL在5.5.3版本之后增加了一个utf8mb4的编码

utf8mb4 :正宗的 utf8 字符集,使用1~4个字节表示字符

5、utf8mb3和utf8mb4的区别

关于utf8mb3和utf8mb4,其主要区别在于:most bytes 3和most bytes 4,
即最多使用3 / 4个字节来表示1个字符,所以,当使用utf8mb4时,
可以表示更多字符,例如生僻汉字、冷门符号、emoji表情符号等。
在使用MySQL / MariaDB时,所有SQL语句中涉及的字符集都明确的使用utf8mb4,尽量不要使用utf8。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值