Python 爬虫，lxml模块，XPath语法提取页面数据

最新推荐文章于 2024-01-10 09:49:20 发布

houyanhua1

最新推荐文章于 2024-01-10 09:49:20 发布

阅读量1.1k

点赞数

分类专栏： Python+ 文章标签： Python lxml 爬虫 xpath

本文链接：https://blog.csdn.net/houyanhua1/article/details/86487887

版权

XPath语法参考：https://blog.csdn.net/houyanhua1/article/details/86484770

demo.py（lxml模块，XPath语法提取页面数据）：

# coding=utf-8
from lxml import etree

# 模拟html页面
text = ''' <div> <ul>
        <li class="item-1"><a>first item</a></li>
        <li class="item-1"><a href="link2.html">second item</a></li>
        <li class="item-inactive"><a href="link3.html">third item</a></li>
        <li class="item-1"><a href="link4.html">fourth item</a></li>
        <li class="item-0"><a href="link5.html">fifth item</a>
        </ul> </div> '''  #

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

houyanhua1

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python 爬虫，lxml模块，XPath语法提取页面数据

XPath语法参考：https://blog.csdn.net/houyanhua1/article/details/86484770 demo.py（lxml模块，XPath语法提取页面数据）：# coding=utf-8from lxml import etree# 模拟html页面text = ''' &lt;div&gt; &lt;ul&gt; &lt...
复制链接

扫一扫