【Django】连接MySQL使用utf8mb4字符集

Django向MySQL中插入的字符串包含特殊Unicode字符时报错:

django.db.utils.OperationalError: (1366, "Incorrect string value: '\\xF0\\x9D\\x90\\xBF' for column 'abstract' at row 1")

该字符是一个4字节的Unicode字符,而MySQL的utf8编码最多只能存储3个字节的字符

>>> b'\xF0\x9D\x90\xBF'.decode('utf8')
'𝐿'

在MySQL中要存储4个字节的Unicode字符必须使用utf8mb4字符集
首先要设置数据库或表的字符集为utf8mb4

CREATE DATABASE foo CHARACTER SET utf8mb4;

Django连接数据库的配置中也要指定charset选项:

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'OPTIONS': {
            'read_default_file': '.mylogin.cnf',
            'charset': 'utf8mb4',
        },
    }
}

增加该选项后即可正常存储4字节字符
charset参数将被传递给底层连接器mysqlclient,Django的MySQL后端默认给该参数赋值为utf8,而OPTIONS将覆盖默认值

参考代码django.db.backends.mysql.base.DatabaseWrapper.get_connection_params()

def get_connection_params(self):
	kwargs = {
		'conv': django_conversions,
		'charset': 'utf8',
	}
	settings_dict = self.settings_dict
	if settings_dict['USER']:
		kwargs['user'] = settings_dict['USER']
	# ....
	options = settings_dict['OPTIONS'].copy()
	# ...
	kwargs.update(options)
	return kwargs

参考文档:
https://docs.djangoproject.com/en/latest/ref/databases/#connecting-to-the-database
https://mysqlclient.readthedocs.io/user_guide.html#functions-and-attributes

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值