php serialize 乱码,python phpserialize加载unicode字符串失败

这是我的序列化字符串,包括中文字符:'a:2:{s:3:"key";s:0:"";s:8:"solution";a:1:{i:0;a:1:{i:0;a:3:{s:4:"text";s:6:"**你好";s:3:"fig";N;s:5:"score";i:0;}}}}'

下面是我的python脚本:

^{pr2}$

错误如下:Traceback (most recent call last):

File "test.py", line 8, in

print phpserialize.loads(phpstring,decode_strings=True)

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 522, in loads

object_hook, array_hook)

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 512, in load

return _unserialize()

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 497, in _unserialize

return array_hook(_load_array())

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 463, in _load_array

item = _unserialize()

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 490, in _unserialize

_expect(b'"')

File "/usr/lib/python2.7/dist-packages/phpserialize.py", line 444, in _expect

raise ValueError('failed expectation, expected %r got %r' % (e, v))

ValueError: failed expectation, expected '"' got 'o'

我已经找到原因了。在

在php中,汉字被编码和序列化为UTF-8,其中包含6个文本字符:'a:2:{s:3:"key";s:0:"";s:8:"solution";a:1:{i:0;a:1:{i:0;a:3:{s:4:"text";s:6:"**\u4f60\u597d";s:3:"fig";N;s:5:"score";i:0;}}}}'

但是当它进入python时,字符串变成了文本中包含8个字符的字符串:'a:2:{s:3:"key";s:0:"";s:8:"solution";a:1:{i:0;a:1:{i:0;a:3:{s:4:"text";s:6:"**\xe4\xbd\xa0\xe5\xa5\xbd";s:3:"fig";N;s:5:"score";i:0;}}}}'

因此,当我将字符串中的长度从6更改为8时,可以在python中正确加载它。在

但是在我的数据库中有数以百万计的序列化字符串等待在python中进行处理。在

如何在Python中正确加载这些Unicode字符串?在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值