CSS选择器和xpath选择器

最新推荐文章于 2024-07-28 18:10:16 发布

G_scsd

最新推荐文章于 2024-07-28 18:10:16 发布

阅读量1.9k

点赞数

分类专栏：爬虫 python 文章标签： CSS选择器 xpath选择器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gscsd_T/article/details/80211018

版权

python 同时被 2 个专栏收录

66 篇文章 6 订阅

订阅专栏

18 篇文章 4 订阅

订阅专栏

CSS选择器

div a::text div下面的a标签的text文本

div.agree h1 a li::text 属性为agree的div下面的h1标签下面的a标签下面的li的文本

div img.mimg::attr(src) div下面的mimg属性的img标签中的src属性中的内容

div ul.a.b.c li::text div下面的属性为a b c三个属性的ul下面的li中的text文本

Xpath

Xpath是什么

1. Xpath是一门语言

2. Xpath可以在xml文档中查找信息

3. Xpath支持HTML

4. Xpath通过元素和属性进行导航

5. Xpath可以用来提取信息

6. Xpath比正则表达式厉害

7. Xpath比正则表达式简单

安装lxml库

from lxml import etree 导入

Selector = etree.HTML(网页源代码) 获取

Selector.xpath（一段神奇的符号）提取

使用xpath的使用

1. Xpath与HTML结构

a) 树状结构

b) 逐层展开

c) 逐层定位

d) 寻找独立节点

2. 获取网页元素的xpath

a) 手动分析法

列：html->body->div>ul[@useful]->li

这里ul属性也写成ul[@id=”useful”]

b) Chrome生产法

将鼠标放在该节点上，右键copy xpath

3. 应用xpath提取内容

a) // 定位根节点

b) / 往下层寻找

c) 提取文本内容：/text()

d) 提取属性内容：/@xxxx

Xpath的特殊用法

1. 以相同的字符开头

starts-with(@属性名称，属性字符相同的部分)

列：starts

//div[start-with(@id,”text”)]/text()

提取div中id为text开头的所有文本内容

2. 标签套标签

string(.)

第一行中得到的是一个列表，虽然里面只有一个元素，但我们还是要把第一个提取出来

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CSS选择器和xpath选择器

CSS选择器 div a::text div下面的a标签的text文本 div.agree h1 a li::text 属性为agree的div下面的h1标签下面的a标签下面的li的文本 div img.mimg::attr(src) div下面的mimg属性的img标签中的src属性中的内容 div ul.a.b.c li::text d...
复制链接

扫一扫

专栏目录

G_scsd CSDN认证博客专家 CSDN认证企业博客

码龄7年

121: 原创

3万+: 周排名

2万+: 总排名

51万+: 访问

: 等级

5579: 积分

299: 粉丝

339: 获赞

257: 评论

1356: 收藏

私信

关注

热门文章

分类专栏

MySQL 1篇
python 66篇
大数据 1篇
pyspark 16篇
Mongo 1篇
ElasticSearch 1篇
docker 2篇
tornado 1篇
python学习 30篇
MySQL数据库 9篇
Django 16篇
Linux 5篇
hadoop 13篇
spark 7篇
Hive 5篇
kafka 2篇
flume 2篇
爬虫 18篇
java 1篇
学习 6篇
程序人生 1篇

最新评论

Python连接MySQL数据库连接池
G_scsd: 应该是，具体的你可以问问ChatGPT，相信能给你更好的答案
Python连接MySQL数据库连接池
魣鮟: 大佬您的意思是不管是不是不同的连接事务都会持续的运行下去是吗
Python连接MySQL数据库连接池
G_scsd: 那有可能是你用的时候刚好连接池断掉了，你加个异常等待试试
Python连接MySQL数据库连接池
魣鮟: 这样吗大佬，我实验的结果是新生成的连接并不能支持当前事务继续执行下去了，会抛出错误来。。。这是啥情况嘞？？
Python连接MySQL数据库连接池
G_scsd: 如果连接池不可用，服务会在超时结束前等待有效的连接池过来，连接是新的，你可以把连接看做一个令牌，有就行，不用管是不是新旧，只要有效会就接着执行，更何况你还没提交呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。