python爬虫，爬虫豆瓣网首页下方“热点内容”及“热点话题”中全部标题文字链接

最新推荐文章于 2023-07-16 12:50:18 发布

王一木w

最新推荐文章于 2023-07-16 12:50:18 发布

阅读量507

点赞数 1

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_73785732/article/details/127452608

版权

import requests
  #提前安装request包
from lxml import etree
  #提前安装lxml包
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36 Edg/106.0.1370.47"}
  #找到请求头
res=requests.get("https://www.douban.com/",headers=headers)
select=etree.HTML(res.text)
aa=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[1]/div[1]/a/@href')
bb=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[2]/a/@href')
cc=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[3]/a/@href')
dd=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[4]/a/@href')
ee=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[5]/a/@href')
ff=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[6]/a/@href')
gg=select.xpath('//*[@id="anony-sns"]/div/div[3]/div/div[2]/ul/li[7]/a/@href')
hh=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[1]/a/@href')
ii=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[2]/a/@href')
jj=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[3]/a/@href')
kk=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[4]/a/@href')
ll=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[5]/a/@href')
mm=select.xpath('//*[@id="anony-sns"]/div/div[2]/div[2]/ul/div/ul/li[6]/a/@href')
print(aa)
print(bb)
print(cc)
print(dd)
print(ee)
print(ff)
print(gg)
print(hh)
print(ii)
print(jj)
print(kk)
print(ll)
print(mm)