Windows 环境下,使用Python库BeautifulSoup抓取网页(BeautifulSoup不是默认安装的库,需要使用pip install 进行安装),分析到的网页出现 unicodeencodeerror.
经分析,原始是windows的默认编码是GBK(可以在windows命令行下,用chcp查询活动代码页,对应的数字是936,对应的默认编码是GBK),在用print打印BeautifulSoup抓
取的网页时,部分Unicode字符无法识别,出现unicodeencodeerror,解决的方法如下:
geth1text=geth1text.encode('GB18030')