解决数据库unicode编码导致字符串读取问题

48 篇文章 1 订阅
10 篇文章 0 订阅

数据库设置编码为:utf8mb4_unicode_ci
在业务上用数据库已经存储带空格的字符去对比真实输入带有空格的字符串数据,就会遇到表面上看过去一模一样,经过程序对比却是返回False
例子:
数据库可视化查询结果如下:
在这里插入图片描述

用程序查询出来的结果:

>>> data
[('Free\xa0Pray')]

这显然无法正常匹配的上,用unicodedata库即可解决该问题。
解决方案:

new_str = unicodedata.normalize("NFKD", unicode_str)
>>> input_name
'Free Pray'
>>> db_name
'Free\xa0Pray'
>>> input_name == db_name
False
>>> import unicodedata
>>> new_name = unicodedata.normalize("NFKD", db_name)
>>> new_name
'Free Pray'
>>> new_name == input_name
True

详情可参考官方文档:https://docs.python.org/2/library/unicodedata.html#unicodedata.normalize

如果觉得文章对您有帮助,欢迎点赞,收藏、关注!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值