Mysql设置字符集编码,程序设置连接客户端编码来解决emoji表情
emoji表情现在是日常生活中必不可少的存在了,首先我们先了解一下为什么emoji表情不能像普通的字符处理?emoji 其实是表情符号,来自日语词汇“絵文字”(假名为“えもじ”,读音即 emoji)。
最早由栗田穰崇(Shigetaka Kurita)创作,并在日本网络及手机用户中流行。 自苹果公司发布的 iOS 5 输入法中加入了emoji 后,这种表情符号开始席卷全球。
目前 emoji 已被大多数现代计算机系统所兼容的 Unicode 编码采纳,普遍应用于各种手机短信和社交网络中。
主要是因为MySQL 默认使用的是UTF8 编码,UTF8 编码只支持 1-3 个字节。
而 emoji 占有 4 个字节的存储空间,所以自然保存不了。但是从 MYSQL5.5 开始,可支持 4 个字节 UTF 编码,只要将编码标记成 utf8mb4 即可。并且utf8mb4 是兼容 UTF8 的。
接下来就是处理这个问题的一些方法:从数据库和程序出发解决问题!
1.设置数据库,表,字段编码为utf8mb4
根据自己的需求选择设置字符集编码,可以手动设置(直接选中某个字段设置编码方式。数据库只能创建的时候设置,但是不推荐手动创建方式),也可以通过sql语句设置,但是用这两种方式都有可能造成锁表!前提是数据量特别大,所以请慎重!
-
设置某个字段字符集编码
alter table `tableName` change 字段名 字段名 varchar(20) character set 字符集编码;
-
设置数据库表的字符集编码
# 默认的字符排序规则 ALTER TABLE offline_hana_ztbasic CONVERT TO CHARACTER SET utf8mb4; # 可以设置字符排序规则 ALTER TABLE offline_hana_ztbasic9 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
-
修改某个数据库的字符集编码
alter database `databaseName` default character set 字符集编码;
-
修改数据库默认的字符集编码
打开 MySQL 配置文件(Windows 下是 my.ini,Linux 下是 my.cnf)修改配置,将编码改成 utf8mb4
[client] default-character-set=utf8mb4[mysql] default-character-set=utf8mb4[mysqld] init-connect=’SET NAMES utf8mb4′ character-set-server=utf8mb4
修改之后必须重启mysql服务。
2.设置客户端连接数据库编码
可能有些人跟我一样,设置完数据库里面的字符编码集后,程序还是报错,问题还是没解决。可能每个人的编码软件不一样或者设置不一样。反正经过上面的设置,已经可以在数据库手动插入emoji表情,并且可以保存。
那么问题来了,怎么解决呢?
根据数据源的不同,设置的也不同。
# 以下是最常用的数据源
# druid的方式
spring.datasource.druid.connection-init-sqls=set names utf8mb4;
# hikari
spring.datasource.hikari.connection-init-sql=set names utf8mb4;
设置完成之后,就大功告成啦!