附录3-爬取58二手房信息,爬取4k图片案例,爬取城市名称,爬取站长素材简历模板(xpath使用案例)

目录

1  爬取58二手房信息

1.1  分析

1.2  代码

2  爬取4k图片案例

2.1  分析

2.2  代码

3  爬取城市名称案例

3.1  分析

3.2  代码

4  爬取站长素材简历模板

4.1  分析

4.2  代码


1  爬取58二手房信息

地址 请输入验证码 ws:121.36.42.44

1.1  分析

我需要标题和价格

1.2  代码

爬完了写txt里就行了

2  爬取4k图片案例

地址 4K风景壁纸_高清4K风景图片大全_彼岸图网

2.1  分析

2.2  代码

3  爬取城市名称案例

地址 PM2.5历史数据_空气质量指数历史数据_中国空气质量在线监测分析平台历史数据

3.1  分析

3.2  代码

4  爬取站长素材简历模板

4.1  分析

项目地址 整套简历-整套简历模板下载

有两种页面,一种是下面这种

还有一种是这样的

4.2  代码

两种页面需要写两种xpath表达式,然后用 或 连接

import requests
from lxml import etree

url = 'https://sc.chinaz.com/jianli/zhengtao.html'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}
response = requests.get(url=url,headers=headers)
response.encoding = response.apparent_encoding
with open('./test.html','w',encoding='utf-8') as f:
    f.write(response.text)
print(response)

tree = etree.HTML(response.text)
detail_htmls = tree.xpath('//div[@class="box col3 ws_block"]/a/@href')

for i in detail_htmls:
    detail_response = requests.get(url=i, headers=headers)
    detail_response.encoding = detail_response.apparent_encoding
    with open('./sub_test.html', 'w', encoding='utf-8') as f:
        f.write(detail_response.text)

    detail_tree = etree.HTML(detail_response.text)

    download_address = detail_tree.xpath('//div[@id="down"]/div[@class="clearfix mt20 downlist"]/ul[@class="clearfix"]/li/a/@href | //div[@id="saleinfo"]/div[@class="pay-haed"]/a/@href')[0]
    # print(download_address)
    print(i + ' 下载中!')

    file_name = download_address.split('/')[-1]
    download_response = requests.get(url=download_address,headers=headers)

    with open('./result/{}'.format(file_name), 'wb') as fp:
        fp.write(response.content)

    print(i + ' 下载成功!')

运行完毕后会得到下面这些压缩包,随便挑了一个解压发现可以解压,并且里面的word可以打开

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Suyuoa

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值