字符集设置问题深究

最新推荐文章于 2021-03-22 22:02:20 发布

HLA_胡

最新推荐文章于 2021-03-22 22:02:20 发布

阅读量1.9k

点赞数

分类专栏：数据库文章标签： mysql 字符集字符编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hla199106/article/details/44497347

版权

1、基础知识

字符(Character)：是文字和符号的总称。例如'A'、'B'、'汉'、'$'等。

字符集(Charset)：是一个系统支持的所有抽象字符的集合。

字符编码(Character Encoding)：是一套法则，描述字符集与数字系统之间建立对应关系。给定一系列字符，对每个字符赋予一个数值，用数值来代表对应的字符，这一数值就是字符的编码(Encoding)。例如，我们给字符'A'赋予数值0，给字符’B'赋予数值1，则0就是字符'A'的编码。

字符序(Collation)：是指在同一字符集内字符之间的比较规则；确定字符序后，才能在一个字符集上定义什么是等价的字符，以及字符之间的大小关系；每个字符序唯一对应一种字符集，但一个字符集可以对应多种字符序。

mysql字符序的命名规则：字符集名字_语言_后缀，
几种常见后缀：_ci(表示大小写不敏感)、_cs(表示大小写敏感)、_bin(表示按编码值比较)
例如：在字符序“utf8_general_ci”下，字符“a”和“A”是等价的；

2、常用字符集和字符编码

2.1.ASCII、Latin-1

ASCII字符集：主要包括控制字符（回车键、退格、换行键等）；可显示字符（英文大小写字符、阿拉伯数字和西文符号）。

ASCII编码：将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位（bits）表示一个字符，共128字符；但是7位编码的字符集只能支持128个字符。

ISO-8859-1又称Latin-1：是一个8位单字节字符集，它把ASCII的最高位也利用起来，并兼容了ASCII，新增的理论空间是128，但它并没有完全用完。

2.2.GB2312、GBK

GB2312字符集：中国国家标准简体中文字符集，包括基本汉字，缺少罕用字。

GBK字符集：GB2312字符集的扩展，支持中国国内少数民族的文字，汉字收录范围包含繁体汉字以及日韩汉字。

GBK编码：采用多字节编码。

2.3.Unicode

Unicode字符集：世界上所有的符号纳入其中，每一个符号都给予一个独一无二的编码，以满足跨语言、跨平台进行文本转换、处理的要求。

Unicode编码：计算机一般使用 4个字节（32 位）(两个字节不够用时)来存放一个序号，该序号为每个字符在 UNICODE 字符集中的序号。

2.4.UTF

UTF：是Unicode 的实现（或存储）方式，称为Unicode转换格式。Unicode是字符集，UTF-32/ UTF-16/ UTF-8是三种字符编码方案。

UTF-8编码：是一种针对Unicode的可变长度字符编码，也是一种前缀码。

Utf-8 中文三个字节，英文一个字节

Unicode 中文两个字节，英文两个字(不够用时4字节)

gb2312，gbk 中文两个字节，英文一个字节

Unicode编码转换为UTF-8编码：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
字符集设置问题深究

1、基础知识字符(Character)：是文字和符号的总称。例如'A'、'B'、'汉'、'$'等。字符集(Charset)：是一个系统支持的所有抽象字符的集合。字符编码(Character Encoding)：是一套法则，描述字符集与数字系统之间建立对应关系。给定一系列字符，对每个字符赋予一个数值，用数值来代表对应的字符，这一数值就是字符的编码(Encoding)。例如，我们给
复制链接

扫一扫

专栏目录

HLA_胡 CSDN认证博客专家 CSDN认证企业博客

码龄10年

125: 原创

10万+: 周排名

134万+: 总排名

27万+: 访问

: 等级

3519: 积分

70: 粉丝

108: 获赞

50: 评论

505: 收藏

私信

关注

热门文章

分类专栏

JAVA基础 33篇
杂谈 4篇
数据库 12篇
面试 2篇
安全 4篇
网络编程 5篇
书籍 1篇
操作系统
数据结构--算法 23篇
设计模式 4篇
JVM 6篇
框架 13篇
java容器类 9篇
java并发编程 8篇
分布式架构 18篇
面试题 26篇
Linux系列 1篇
Maven 3篇

最新评论

数据结构---位运算
或跃_在渊: (i & 1) //两个只要有一个是偶数就为等于0
Spring---IOC简介
褚念荣: IOC也被称为DI依赖注入，你这解释有问题啊兄弟
JVM-性能调优
Tisfy: 十分完美，正如：闻道黄龙戍，频年不解兵。
Mysql事务的实现原理
scoratesc: 我也觉得不够系统，云里雾里的，不过比其他的还是具体了很多
java中equals，hashcode和==的区别
负债程序猿: 博主讲的很好呀，如果还有朋友对hashcode或者hash算法不清楚的，可以看看这篇https://blog.csdn.net/qq_33709582/article/details/113337405

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。