实例——Python爬虫requests爬取亚马逊商品页面

本文通过实例展示了如何使用Python的requests库,模拟浏览器访问,成功爬取亚马逊商品页面。首先复制商品URL,然后利用requests.get()方法获取页面信息。在遇到访问限制时,通过设置User-Agent为常见浏览器标识,成功绕过限制并获取到页面内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.打开亚马逊官网,随机浏览一商品详细页,复制URL。 

 

2.用requests.get()方法获取网页相关信息

import requests
r = requests.get("https://www.amazon.cn/dp/B07TLJS1HH/ref=s9_acsd_hps_bw_c2_x_0_i?pf_rd_m=A1U5RCOVU0NYF2&pf_rd_s=merchandised-search-2&pf_rd_r=F0G8E7GQ2HTW6CHPF25Z&pf_rd_t=101&pf_rd_p=90054d28-bb64-4490-8abc-8f710c113be9&pf_rd_i=116169071")

r.status_code  #打印结果为:503,说明访问出现错误。
r.encoding     #查看它的编码,打印结果:ISO-8859-1,
r.encoding = r.apparent_encoding  #把编码改成它可执行的编码
r.text          #查看返回的文本

打印文本结果显示:

<
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值