如果发现emoji存储到数据库后是乱码,那么请检查一下该字段类型是否为varchar,如果不是则应修改为nvarchar即可。下面说明原因,首先来说一下varchar和nvarchar的区别(这里用sqlserver举例,其他数据库大同小异)
varchar(n)
长度为 n 个字节的可变长度且非 Unicode 的字符数据。n 必须是一个介于 1 和 8,000 之间的数值。存储大小为输入数据的字节的实际长度,而不是 n 个字节。
nvarchar(n)
包含 n 个字符的可变长度 Unicode 字符数据。n 的值必须介于 1 与 4,000 之间。字节的存储大小是所输入字符个数的两倍。
两字段分别有字段值:我和coffee
那么varchar字段占2×2+6=10个字节的存储空间,而nvarchar字段占8×2=16个字节的存储空间。
如字段值只是英文可选择varchar,而字段值存在较多的双字节(中文、韩文等)字符时用nvarchar
上面是一个总结介绍,通过上面的介绍,可以知道。
varchar(4) 可以输入4个字母,也可以输入两个汉字
nvarchar(4) 可以输四个汉字,也可以输4个字母,但最多四个
这个emoji表情的编码格式采用的就是Unicode,所以数据库字段使用varchar的话会出现乱码,以上方式是从数据库层面解决问题,其实也可以不修改数据库字段,那就是在从前端传到服务端前,可以自行编码,例如使用js中的encodeURIComponent函数,因此存储的实际上是编码后的emoji数据,在从服务端返回emoji表情数据的时候,用decodeURIComponent函数进行解码就行了。