爬取亚马逊bestsellers首页的链接

为了方便构造小类目的链接,你的首先知道大类目的链接,
比如你 知道了大类名称之后,在其的小类目的id直接凭借到其后面就可了
在这里插入图片描述
1.代码如下:
在这里插入图片描述

import requests
url='https://www.amazon.co.jp/gp/bestsellers'
headers={
   'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'
}
resp=requests.get(url=url,headers=headers)
from scrapy.selector import Selector
select=Selector(resp)
li_list=select.xpath('//*[@id="zg_browseRoot"]/ul//li')
for li in li_list:
    link_kinds=li.xpath('./a/@href').extract()
    kinds=li.xpath('./a/text()').extract()
    print(kinds+link_kinds)

#保存的话,我是保存为csv文件
# 保存csv文件,需要传入一个列表。
import csv
with open("./kinds_link.csv",'a',encoding="utf-8",newline='') as csvfile:
    writer = csv.writer(csvfile)
    for li in li_list:
        link_kinds=li.xpath('./a/@href').extract()
        kinds=li.xpath('./a/text()').extract()
        print(kinds+link_kinds)
        writer.writerow(kinds+link_kinds)  #按行写入

2.另外还有一种解析为xpath的包效果一样的,,
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weixin_43351935

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值