python中xpath基本用法

最新推荐文章于 2024-04-07 08:00:00 发布

dayun555

最新推荐文章于 2024-04-07 08:00:00 发布

阅读量3.6k

点赞数 7

分类专栏： python

本文链接：https://blog.csdn.net/dayun555/article/details/79405437

版权

python 专栏收录该内容

74 篇文章 2 订阅

订阅专栏

1.网页的解析方式

        1)xpath(简单)
        2)正则(最难)
        3)css(需要懂网页的css)
        4)bs4(比xpath难一点点)

2.xpath的基本用法

        1）环境准备：首先安装火狐浏览器(版本不能太高)
                    在浏览器右上角三个横杠-->附加组件-->获取附加组件-->搜索firebug和firepath两个插件安装，如果提示重启,点击那个重启即可
        2）验证环境是否配置成功：右键点击网页-->Inspect in FirePath 看是否能点击成功
        3）基本操作
            //元素标签名    例如：//div 功能是查找网页内的所有div
            //元素标签名[@属性名=’具体内容‘]   例如：//div[@class='box'] 功能是查找存在属性@class='box'的div
            //元素标签名[第几个]     例如：//div[@class="box"][2] 查找符合条件的第二个div
            //元素1/元素2/元素3...   例如：//ul/li/div/a/img 查找ul下的li下的div下的a下的img标签
            //元素1/@属性名          例如：//ul/li/div/a/img/@src 查找ul下的li下的div下的a下的img标签的src属性
            //元素/text()   例如：//a/text() 获取a标签下的文本(一级文本)
            //元素//text() 例如：//div[@class='box']//text() 获取class=‘box’的div下的所有文本
            //元素[contains(@属性名，'相关属性值')]   例如：//li[contains(@class,'zhangsan')] 查找class中包含zhangsan的div
            //*[@属性='值'] 例如：//*[@name='lisi'] 查找name为lisi的元素

dayun555

关注

7
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
python中xpath基本用法

1.网页的解析方式 1)xpath(简单) 2)正则(最难) 3)css(需要懂网页的css) 4)bs4(比xpath难一点点) 2.xpath的基本用法 1）环境准备：首先安装火狐浏览器(版本不能太高) 在浏览器右上角三个横杠--&gt;附加组件--&gt;获取附加组件--...
复制链接

扫一扫