MySQL 字符序核心概念

Author:3# 一个专注于web技术的80后
核心就是一句话:软件开发要知其然知其所以然。
CSDN@3#,CSDN官方首发,`3#原创
博客: 👉 极客小俊GeekerJun 👈

在这里插入图片描述

字符集

什么是字符集?

字符集就是字符的集合,例如熟知的有ASCII字符集、Unicode字符集、GB2312字符集,每个字符集包含的字符个数是不同的,ASCII字符集包含了128字符,unicode字符集包含了1114112 个字符(目前只有少数使用,大部分还是空闲的),GB2312包含了汉字6763个,文字符号682个。

注意:GB2312字符集是不包含英文字符的,但是如果我们要在GB2312字符集中使用英文字符怎么办呢,那好办,如果在GB2312中找不到的字符,就会去ASCII字符集中去找。

细心的同学会发现,在mysql数据库中,有着两种相似的字符集,utf8和utf8mb4,那么这两种字符集是不是有什么暧昧关系?同学,我只能这么说…你这猜想是完全正确滴!

传说啊,在mysql5.3以前,只存在utf8,而且这个utf8和我们平常所说的utf-8是有差别的,平常我们所说的utf-8表示一个字符使用的字节数为[1, 4]个字节,即[1, 4]个码元,但是,数据库里面的utf8表示一个字符所使用的字节数为[1, 3],三个字节只能表示unicode字符集中基本语言平面的字符,是不完全的,所以千万不要把数据库中的utf8和utf-8编码弄混了,要分清他们的区别。这时,一声巨响,mysql5.3诞生了,并且还带着utf8mb4字符集一起诞生的,utf8mb4的出现完全就是弥补utf8的缺陷,使其可以表示出unicode字符集中的所有字符。

所以,推荐大家平常还是使用utf8mb4吧,可能更好的兼容utf-8编码。兼的死死的。

排序规则

什么又是排序规则呢?

排序规则就是按照特定的顺序对字符进行排序,也供搜索使用,例如当我们去数据库中查询表中的数据时,就会根据排序规则去查找,还有就是当我们使用order by时,也是根据排序规则进行查找的。

每一种字符集对应了多种排序规则,且每个排序规则只对应一种字符集,是一种典型的1对多的关系。

那么接下来就得介绍一下排序规则都有哪些了。以utf8字符集举例

utf8_general_ci: 查询时不区分大小写匹配
utf8_general_cs: 查询时区分大小写匹配
utf8_bin: 字符串每个字符串用二进制数据编译存储。 区分大小写,而且可以存二进制的内容,与utf8_general_cs一样,区分大小写
utf8_unicode_ci : 和utf8_general_ci一样,不区分大小写

排序规则的命名是有约束的,开头只能是对应字符集的名称,中间是语言的名称,最后是类型,ci代表的是case insensitive,即大小写不敏感,cs代表的是case sensitive,即大小写敏感的

那么大小写敏不敏感在mysql中有啥区别呢?

例如现在是大小写不敏感的,如果此时去查a,则会将A和a一起查出来。

如果是大小写敏感的,如果再去查a,则只会查出来a。

排序规则的基本定义说的差不多了,接下来就结合mysql进行实战吧。

mysql支持的字符集

查询mysql支持的字符集可以使用一下命令
# 方式1
SHOW CHARACTER SET;

# 方式2
use information_schema;
select * from CHARACTER_SETS;

上面结果中的latin1、latin2可能大家很陌生,但是说到另一种字符集iso-8859-1大家可能很是熟悉,尤其是搞web的童鞋,其实latin1就是iso-8859-1的别名,iso-8859系列一共有15个,iso-8859-n(n=1,2,3,4…16),其中不包括12,

每一种字符集都有一个默认的字符序,即上述的DEFAULT_COLLATE列。

如果查看mysql支持的字符序以及每种字符集默认的字符序呢?
# 第一种方式
show collation;

# 第二种方式
use information_schema;
select * from collations;

可以看到,带yes所对应的记录就是前面字符集对应的默认字符序。

修改数据库系统字符集以及字符序

当我们创建数据库时候,如果没有指定字符集和字符序,mysql就会使用默认的字符集以及字符序,也就是character_set_server、collation_server 。如何查看这些信息呢?

SHOW VARIABLES;
如何修改这些配置呢?

打开my.ini, 修改如下

[client]
default-character-set=utf8

[mysql]
default-character-set=utf8

[mysqld]
collation-server = utf8_general_ci
init-connect='SET NAMES utf8'
character-set-server = utf8

重新启动mysql服务 就可以了!!

如果我们在创建数据库时如何指定字符集以及编码?

图形界面的操作我就不提了,我就说一说命令的方式 , 如下

CREATE DATABASE db_name				 #name指数据库名
    [CHARACTER SET charset_name]     #这里的name具体是什么查一下character set charset 8大变量就知道了
    [COLLATE collation_name]  				#这里的name指的是字符序, 具体是哪一种 查一下表就可以了!

如果只指定字符集,没有指定字符序,那么mysql就会使用此字符集默认的排序规则,如果只指定了字符序,而没有指定字符集,那么mysql就会使用此字符序对应的字符集。

还有就是数据库中表使用的字符集以及字符序,如果我们在创建表的时候指定了字符集以及字符序,那么此表就会使用指定的,如果没有指定字符序或者字符集,那么此表就会使用所属数据库的字符集以及字符序。

# 创建表示指定字符集以及字符序
CREATE TABLE tbl_name (column_list)
    [[DEFAULT] CHARACTER SET charset_name]
    [COLLATE collation_name]]

# 修改表的字符集以及字符序
ALTER TABLE tbl_name
    [[DEFAULT] CHARACTER SET charset_name]
    [COLLATE collation_name]

表中的列也是存在字符集以及字符序的,如果在创建列的时候指定了字符集以及字符序,那么此列就会使用指定的,如果没有指定,那么就使用所属表的字符集以及字符序。

# 创建列时指定字符集以及字符序
col_name {CHAR | VARCHAR | TEXT} (col_length)
    [CHARACTER SET charset_name]
    [COLLATE collation_name] 
    
# 修改列的字符集以及字符序
ALTER TABLE test_table ADD COLUMN char_column VARCHAR(25) CHARACTER SET utf8;

一个mysql下,每个库可以使用不同的字符集,每个库下的所有表也可以使用不同的字符集,以及每个表中列也可以使用不同的字符集。

一般都是创建数据库时候指定字符集,然后再创建表的时候以及创建列的时候都不会指定字符集以及字符序。

系统字符集的查看

查看某个数据库的字符集以及字符序

use test_schema;
SELECT @@character_set_database, @@collation_database;

查看当前选择数据库下的 所有表字符集以及字符序

SHOW TABLE STATUS;

首先需要选中某个数据库,然后才可执行
查看某一列的字符集以及字符序

SELECT CHARACTER_SET_NAME, COLLATION_NAME FROM information_schema.COLUMNS WHERE TABLE_SCHEMA="test_schema" AND TABLE_NAME="test_table" AND COLUMN_NAME="char_column"

在这里插入图片描述
在这里插入图片描述

如果我的博客对你有帮助、如果你喜欢我的博客内容,请 “点赞” “评论” “收藏” 一键三连哦!
听说 👉 点赞 👈 的人运气不会太差,每一天都会元气满满哦 嘿嘿!!! ❤️ ❤️ ❤️
大家的支持就是我坚持下去的动力。点赞后不要忘了👉 关注 👈我哦!
更多精彩内容请前往
极客小俊GeekerJun 的博客


如果以上内容有任何错误或者不准确的地方,欢迎在下面 👇 留个言指出、或者你有更好的想法,欢迎一起交流学习~~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极客小俊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值