python爬虫亚马逊评论_Python爬虫三 Requests库爬取亚马逊报503错误

最新推荐文章于 2024-05-21 20:55:00 发布

程医生

最新推荐文章于 2024-05-21 20:55:00 发布

阅读量1.3k

点赞数 1

文章标签： python爬虫亚马逊评论

本文链接：https://blog.csdn.net/weixin_28740399/article/details/113672583

版权

代码

import requests

def getHTMLText(url):

try:

r = requests.get(url, timeout=30)

r.raise_for_status()

r.encoding = r.apparent_encoding

return r.text[:10000]

except Exception as err:

return str(err)

if __name__ == '__main__':

url = 'https://www.amazon.cn/dp/B077B7Z1C1?ref_=Oct_DotdV2_PC_2_GS_DOTD_56a14cb3&pf_rd_r=XF9AG6HRPAWC2MGNWJQ8&pf_rd_p=8c48638a-3752-448a-8685-5a17153fb132&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=desktop-2'

print(getHTMLText(url))

报503错误

原因

亚马逊对请求来源进行审查

我们的Requests库会忠实的告诉亚马逊请求来源为‘python-requests/2.11.1’

解决办法

import requests

def getHTMLText(url)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

程医生

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬虫亚马逊评论_Python爬虫三 Requests库爬取亚马逊报503错误

代码import requestsdef getHTMLText(url):try:r = requests.get(url, timeout=30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.text[:10000]except Exception as err:return str(err)if __name__ =...
复制链接

扫一扫