- 博客(2)
- 资源 (1)
- 收藏
- 关注
转载 python转码问题: in position 30664-30665: illegal multibyte sequence
在Python中,可以对String调用decode和encode方法来实现转码。 比如,若要将某个String对象s从gbk内码转换为UTF-8,可以如下操作 s.decode('gbk').encode('utf-8′) 可是,在实际开发中,我发现,这种办法经常会出现异常: UnicodeDecodeError: ‘gbk' codec can't decode byte
2016-12-08 19:38:54 642
原创 [python爬虫]对html解析读取编码格式,统一转码为utf-8
from urllib.request import urlopen import chardet response=urlopen(url,timeout=3) html_byte=response.read() chardit1 = chardet.detect(html_byte) file = open(PROJ
2016-12-05 10:55:32 10708
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人