xpath基本案例(Python)

**#相关介绍:xpath是在XML文档中搜索内容的一门语言;html是xml的一个子集。
一、首先安装lxml模块,这里以pycharm开发环境为例,在Terminal命令行输入pip install lxml 出现如下页面即是安装成功。在这里插入图片描述
1.再介入案例之前,首先看一个小例子:
xml在这里插入图片描述

在这里插入图片描述
(1)先从lxml模块导入etree包;
(2)xml可以看作是网页源代码(相关知识html标签语言)
(3)第20行拿到页面源代码(调用XML方法);
(4)调用xpath方法。
输出结果如下:
在这里插入图片描述
二、关于xpath基本案例
1.拿到页面源代码(以猪八戒网为例)

import requests
from lxml import etree

url = "https://taiyuan.zbj.com/sem_search/f/?kw=sass"
res = requests.get(url)

2.HTML对源代码进行解析

xml = etree.HTML(res.text)

3.拿到每一个服务商的div

divs = xml.xpath("/html/body/div[6]/div/div/div[2]/div[7]/div/div[1]")

在这里插入图片描述
右击选择复制->复制xpath,然后粘贴到代码区。
4.遍历服务商信息

for div in divs:#每一个服务商信息
    result1 = div.xpath("./div/div/a[2]/div[2]/div[1]/span[1]/text()")
    result2 = div.xpath("./div/div/a[2]/div[2]/div[1]/span[2]/text()")
    print(result1, result2)

['¥5000'] ['近半年成交:0笔']

成功爬取此信息。小伙伴们也可以用同样的方法爬取更多的信息。
在这里插入图片描述

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值