'latin-1' codec can't encode character 的解决方案

最新推荐文章于 2024-05-24 22:48:30 发布

尽拣寒枝不肯栖

最新推荐文章于 2024-05-24 22:48:30 发布

阅读量4.3w

点赞数 1

分类专栏： database

database 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

分析一个字符串，并更新数据库的时候，出现了如下错误：
'latin-1' codec can't encode character u'\u017e' in position 11: ordinal not in range(256)

进行了一些研究发现，原因是，数据库的编码和数据源的编码不一致，并且包含了不能处理的字符。

有两种方法可用，一个是先预先处理一下字符串，二是设置数据库参数

1. 处理字符串

>>> u = u'hello\u2013world'
>>> u.encode('latin-1', 'replace') # replace it with a question mark
'hello?world'
>>> u.encode('latin-1', 'ignore') # ignore it
'helloworld'
或者根据需求进行处理
>>> u.replace(u'\u2013', '-').encode('latin-1')
'hello-world'
If you aren't required to output Latin-1, then UTF-8 is a common and preferred choice. It is recommended by the W3C and nicely encodes all Unicode code points:
>>> u.encode('utf-8')
'hello\xe2\x80\x93world

2. 设置数据库

db.set_character_set('utf8')
dbc.execute('SET NAMES utf8;')
dbc.execute('SET CHARACTER SET utf8;')
dbc.execute('SET character_set_connection=utf8;')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

尽拣寒枝不肯栖

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
'latin-1' codec can't encode character 的解决方案

分析一个字符串，并更新数据库的时候，出现了如下错误：'latin-1' codec can't encode character u'\u017e' in position 11: ordinal not in range(256)进行了一些研究发现，原因是，数据库的编码和数据源的编码不一致，并且包含了不能处理的字符。有两种方法可用，一个是先预先处理一下字符串，二是设置数据库参
复制链接

扫一扫