爬虫编码问题

最新推荐文章于 2024-01-25 11:56:25 发布

大白的进阶之路

最新推荐文章于 2024-01-25 11:56:25 发布

阅读量342

点赞数

本文链接：https://blog.csdn.net/lyhfight/article/details/83474254

版权

手写https://tech.china.com/article/20180529/20180529144614.html爬虫时，遇到下载页码乱码问题，经查资料解决，通过requests获取的编码不是GBK，而是ISO-8859-1。将页面编码改为 urf-8,此编码与主题无关，只是网上查到的方法

import requests

url = 'http://search.51job.com/jobsearch/search_result.php?fromJs=1&jobarea=090200%2C00&funtype=0000&industrytype=00&keyword=python&keywordtype=2&lang=c&stype=2&postchannel=0000&fromType=1&confirmdate=9'
r = requests.get(url)
r.encoding = 'GBK'
print r.text

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大白的进阶之路

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫编码问题

手写https://tech.china.com/article/20180529/20180529144614.html爬虫时，遇到下载页码乱码问题，经查资料解决，通过requests获取的编码不是GBK，而是ISO-8859-1。将页面编码改为 urf-8,此编码与主题无关，只是网上查到的方法 import requestsurl = 'http://search.51job.c...
复制链接

扫一扫