unicode
文章平均质量分 68
麦麦麦造
这个作者很懒,什么都没留下…
展开
-
python爬虫中一个str类型的unicode字符串转成中文的问题
本文主要介绍部分爬虫在遇到%u5317%u4eac%u70e4%u9e2d这种类似unicode编码的str类型数据时,无法直接使用decode('unicode-escape')方法来转成中文的时候,一个转码的解决方案,以及这个方案的思路! 今天在爬一个网站的时候,遇到了一个网站,它的一些数据是通过ajax加载进来的一段json,它的value部分的内容是像下面这样子的: %20%20%20...原创 2018-09-29 11:36:58 · 4084 阅读 · 3 评论 -
【优化】py2下hbase的字符串编码问题(\\xe7\\xbc\\x96)
引言 上次写过一篇关于 py2下hbase的字符串编码问题(\xe7\xbc\x96) 的文章,里面的解决方案是正则来进行转换,是一个有点傻但目前又无可奈何的解决方案,并且在最后留下了三个小坑。 本以为应该可以稳定的使用一段时间,没想到才过几天就掉坑里了。 =_=!! 所以这次就开始填坑了吧!! 修改后的代码 talk is cheap ,show me the code! 废话不多说,直接上代...原创 2019-01-08 23:29:25 · 336 阅读 · 0 评论