python中非法表达式_在python中过滤非法xml unicode字符的快速方法?

最近,我们(Trac XmlRpcPlugin维护者)接到通知,上面的正则表达式在Python窄构建上剥离代理项对(请参见th:comment:13:ticket:11050)。另一种方法是使用以下regex(请参见th:changeset:13729)。_illegal_unichrs = [(0x00, 0x08), (0x0B, 0x0C), (0x0E, 0x1F),

(0x7F, 0x84), (0x86, 0x9F),

(0xFDD0, 0xFDDF), (0xFFFE, 0xFFFF)]

if sys.maxunicode >= 0x10000: # not narrow build

_illegal_unichrs.extend([(0x1FFFE, 0x1FFFF), (0x2FFFE, 0x2FFFF),

(0x3FFFE, 0x3FFFF), (0x4FFFE, 0x4FFFF),

(0x5FFFE, 0x5FFFF), (0x6FFFE, 0x6FFFF),

(0x7FFFE, 0x7FFFF), (0x8FFFE, 0x8FFFF),

(0x9FFFE, 0x9FFFF), (0xAFFFE, 0xAFFFF),

(0xBFFFE, 0xBFFFF), (0xCFFFE, 0xCFFFF),

(0xDFFFE, 0xDFFFF), (0xEFFFE, 0xEFFFF),

(0xFFFFE, 0xFFFFF), (0x10FFFE, 0x10FFFF)])

_illegal_ranges = ["%s-%s" % (unichr(low), unichr(high))

for (low, high) in _illegal_unichrs]

_illegal_xml_chars_RE = re.compile(u'[%s]' % u''.join(_illegal_ranges))

更新以便不匹配(替换)0x0D,这是一个valid XML character。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值