py2下hbase的字符串编码问题(\\xe7\\xbc\\x96)

本文主要讨论在Python2环境下使用HBase时遇到的字符串编码问题,包括如何处理utf-8编码后的字符串,尤其是含有双反斜杠的字节码。文中提出了通过正则表达式提取和替换的方法来解决此问题,同时也指出了这种方法在Python3下的不兼容性、大小写问题和特殊字符处理不足等几个潜在问题。
摘要由CSDN通过智能技术生成

py2下hbase的字符串编码问题(\xe7\xbc\x96)

-------start 2019年1月8日更新--------
本文的代码有更新,解决的下面提到的问题2,问题3。

可移步另一篇文章【优化】py2下hbase的字符串编码问题(\xe7\xbc\x96)
-------end 2019年1月8日更新--------

最近在py2的环境下使用hbase,遇到了一个令人恼火的编码问题。问题字符串如下:

'\\XE6\\X89\\X80\\XE8\\XB0\\X93\\XE7\\X89\\XB9\\XE6\\XAE\\X8A\\XE5\\XAD\\X97\\XE7\\XAC\\XA6\\XEF\\XBC\\X8C\\XE5\\XB0\\XB1\\XE6\\X98\\XAF\\XE4\\XB8\\X80\\XE4\\XBA\\X9B\\XE6\\X9C\\X89\\XE7\\X89\\XB9\\XE6\\XAE\\X8A\\XE5\\X90\\XAB\\XE4\\XB9\\X89\\XE7\\X9A\\X84\\XE5\\XAD\\X97\\XE7\\XAC\\XA6\\X0D\\X0A2.\\XE5\\XAE\\X9A\\XE4\\XBD\\X8D\\XE7\\XAC\\XA6\\XE4\\XBD\\XBF\\XE6\\X82\\XA8\\XE8\\X83\\XBD\\XE5\\XA4\\X9F\\XE5\\XB0\\X86\\XE6\\XAD\\XA3\\XE5\\X88\\X99\\XE8\\XA1\\XA8\\XE8\\XBE\\XBE\\XE5\\XBC\\X8F\\XE5\\X9B\\XBA\\XE5\\XAE\\X9A\\XE5\\X88\\XB0\\XE8\
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值