同时存在unicode-escape和utf-8的解码方法
在爬取lc提交代码的时候遇到的一个问题,在爬取到的源码中,符号是采用unicode-escape编码的,而其中的中文是采用utf-8编码的,正常解码无论怎样都会出现乱码,本文记录下解决办法。文章目录示例解决办法示例下面是lc第一题爬取的源码,编码为"utf-8",中文可以正确显示,但是换行符等符号并不能正确显示,因此需要转换。code = "class Solution:\u000A def twoSum(self, nums: List[int], target: int) \u002D
原创
2020-06-09 19:53:51 ·
3457 阅读 ·
0 评论