背景:公司使用阿里云的BI工具来做数据的统计,在这之前的一个步骤是做数据的筛选.这一步使用阿里的DataWorks.使用DataWorks的过程中看log发现有一部分数据是通过DataWorks导入不到目标库的.
原因:由于公司使用的数据库是阿里云的RDS版云数据库,所以在DataWorks中配置数据源时选择的数据源的类型一直都是阿里云数据库(RDS).通过RDS实例ID等信息来配置数据源.所以我猜想这样默认采用的数据库编码是utf8.而emoji表情和一些特殊的字符是4个字节.而Mysql的utf8编码最多3个字节,所以插不进去.
背景知识:
- utf8
-