MySQL的默认编码是Latin1,不支持中文,要支持中文需要把数据库的默认编码修改为gbk或者utf8才行。
在使用mysql命令行查询数据时,经常会遇到中文显示成火星文乱码的情况,像下面这样👇
通过查找资料并尝试解决,有两种可行的方法,总结如下:
方法一:登录mysql时指定编码格式为数据库的编码
- 查看数据库的编码格式, 执行命令:
show create database 数据库名;
下图中查询到该数据库为gbk编码; - 使用gbk编码重新登录数据库:
mysql -u root -proot --default-character-set=gbk
优点:能够解决当务之急
缺点:在命令行只是暂时修改了编码,下次重启mysql就失效了。数据库配置文件my.ini中的默认编码并没有改变,mysql是根据配置文件启动的,所以需要改配置文件中的编码。
方法二:修改数据库的编码格式
解决中文乱码的原理就是,在执行SQL语句之前,将MySQL以下三个系统参数设置为与服务器字符集character-set-server相同的字符集。
set character_set_client=gbk; 客户端的字符集。
set character_set_connection=gbk; 连接字符集
set character_set_results=gbk; 结果字符集。
可以直接用set names gbk;替代上面三个执行命令
-
查看mysql的字符集,执行命令:
show variables like 'character%';
下图中查询到电脑中mysql的字符集为utf8; -
所以需要修改为gbk格式,执行命令:
set names gbk;
或者直接修改数据库my.ini文件中的默认编码格式为default-character-set=gbk
👇
-
将电脑中mysql的字符集修改成与数据库中的字符集保持一致后,查询数据,执行命令:
select * from 表名;
总结:
本篇文章用到的mysql命令
查看mysql的字符集:`show variables like '%character%';`
查看某个数据库字符集:`show create database 数据库名;`
查看某个数据表字符集:`show create table 表名;`
查看某个数据表的字段字符集:`show full fields from 表名;`
指定编码格式登录mysql:`mysql -u root -proot --default-character-set=gbk`
修改字符集编码:`set character_set_client=gbk;`
修改数据库的字符集:`alter database 数据库名 character set gbk;`
修改数据表的字符集:`alter table 表名 character set gbk;`
修改字段的字符集:`alter table 表名 change 字段名 字段名 char(10) character set utf-8;`
关于GBK和UTF-8编码
1、UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示,即在外国人的英文IE上也能显示中文,无需下载IE的中文语言支持包。
2、GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。
3、GB2312是GBK的子集,GBK是GB18030的子集。GBK是包括中日韩字符的大字符集合,如果是中文的网站,推荐GB2312 ,GBK有时还是有点问题。
4、为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便,UTF-8可以看作是大字符集,它包含了大部分文字的编码。使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看文字而不会出现乱码。
gb2312是简体中文的码
gbk支持简体中文及繁体中文
big5支持繁体中文
utf-8支持几乎所有字符
MySQL中涉及的几个字符集
character-set-server/default-character-set:服务器字符集,默认情况下所采用的。
character-set-database:数据库字符集。
character-set-table:数据库表字符集。
优先级依次增加。所以一般情况下只需要设置character-set-server,而在创建数据库和表时不特别指定字符集,这样统一采用character-set-server字符集。
character-set-client:客户端的字符集。客户端默认字符集。当客户端向服务器发送请求时,请求以该字符集进行编码。
character-set-results:结果字符集。服务器向客户端返回结果或者信息时,结果以该字符集进行编码。
在客户端,如果没有定义character-set-results,则采用character-set-client字符集作为默认的字符集。所以只需要设置character-set-client字符集。
要处理中文,则可以将character-set-server和character-set-client均设置为GB2312,如果要同时处理多国语言,则设置为UTF8。