爬虫乱码是一个很常见的问题,给大家分享一个我遇到的案例及解决方案
爬取对象为电影票房(网址:target='http://www.piaofang.biz/')
电影名显示为乱码
此时查看网页源代码,发现显示为gbk
我们需要使用requests库的方法查看编码类型
可以看到编码为ISO-8859-1,然后只需要在对应位置加上encode(ISO-8859-1),中文乱码就可以解决
爬虫乱码是一个很常见的问题,给大家分享一个我遇到的案例及解决方案
爬取对象为电影票房(网址:target='http://www.piaofang.biz/')
电影名显示为乱码
此时查看网页源代码,发现显示为gbk
我们需要使用requests库的方法查看编码类型
可以看到编码为ISO-8859-1,然后只需要在对应位置加上encode(ISO-8859-1),中文乱码就可以解决