经常我们会碰到数据乱码的问题,有页面乱码,java运行时变量里的数据乱码,数据库表数据乱码。我今天主要说说我在工作中遇到的数据库表数据乱码问题怎么解决。
当我们表里数据保存后发现乱码,首先我们要确定数据的来源以及中间处理层的字符集编码是不是一致,比如我们用java从文件中读取一段utf-8的文字然后保存到数据库中时,首先我们得用utf-8编码读取并用utf-8保存到数据库中。也就是说java应用层和数据库的编码必须一致才不会出现乱码。
应用层的编码我们暂时不说,我主要分享一下mysql数据库中的乱码如何解决,关于乱码为什么会出现或者说原理我也讲不通,给个链接,大家自己看,乱码是怎么形成的?
我们出现在数据库乱码时,先确定是不是java层就乱码了,如果不是,那肯定是数据到数据库层才乱码的。所以我们需要再次确认数据库层的每个过程都是utf-8(我们以utf-8编码为例,你用gbk也是可以的),下面就看看怎么看数据库每个有可能造成乱码的地方:
一、MySQL全局编码配置
mysql的全局变量可以通过命令来修改,也可以在my.cnf(windows下配置文件为my.ini)中配置,内容如下:
[mysqld]
character-set-server=utf8
collation_server=utf8_general_ci
[client]
default-character-set=utf8
[mysql]
default-character-set=utf8
如上my.cnf的编码配置,如果我们java读取的文件是utf-8,而在上面某个环节却配置成了gbk,可想而知,乱码!,所以第一我们要检查我们的Mysql配置文件。然后要去看这些配置对应的运行变量是不是已经生效了,没生效,一样会乱码!因为你可能配置到别的文件了,数据库根本就没读到你配置的文件。
我们可以用数据库命令查询以上的变量,看看是不是utf-8:
show variables where Variable_name like '%character%';
如图所示,这样表示全局的编码是utf-8了。这个配置是ok的,我们接着往下看
二、数据库编码属性
我们刚说的数据库全局配置,我们再说库级别的编码属性。我这里说的数据库不是指MySQL数据库服务,是指实实在在的数据库DB,比如名叫mybook的数据库,在创建时没有指定字符编码,那mybook这个数据库的编码属性会默认为上面的全局变量里的,也就是说my.cnf里配置的utf-8
我们可以通过navicat查看我们创建好的库属性(怎么不用命令查看了?额,我没找到啊。。这个逼装不了了)
如上图所示,我们可以看到mybook数据库字符集也是utf8,如果不是,一样会造成utf8数据保存后,乱码!
注意上面的排序规则也要与我们my.cnf里的配置一样,否则,乱码!狠不狠...
三、表的编码属性
我们在创建表的时候也是可以设置表的编码的,比如:
CREATE TABLE `article` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`title` varchar(200) NOT NULL COMMENT '文章标题',
`content` longtext NOT NULL COMMENT '内容',
`tags` varchar(255) NOT NULL COMMENT '标签',
`original` int(11) NOT NULL COMMENT '是否原创 0 转载 1原创',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=24 DEFAULT CHARSET=utf8;如上的语句中我们也指定了编码为utf-8,如果不是,一样可能会乱码,当然,你建表的时候如果不设置,他会默认使用mybook数据库的编码与排序规则
四、字段的编码属性 表字段也是可以设置字符编码和排序规则的,如果字符编码和排序规则与表的编码属性不一致,也是可能乱码的。如上面贴出来的表创建语句中并没有指定字段的编码,所以article这张表的字段属性是默认为建库时的编码。你想查看与编辑字段的编码一样可以用navicat修改。如下图:
如果这里显示的不是你想要的utf-8,当然就会乱码了,另外排序规则也是要一样的
所以综上所述,要想数据库不乱码,首先就是my.cnf要配置成你想的编码格式与排序规则,后续的建库建表与字段都要与my.cnf一致,方能最终解决乱码问题。
还有一个提一下:当我们导入数据,或者两张表数据对拷时,一样会有这些编码问题,请注意