获取＜li＞标签的所有 class

最新推荐文章于 2022-11-06 22:51:36 发布

scan724

最新推荐文章于 2022-11-06 22:51:36 发布

阅读量3.8k

点赞数

分类专栏： Python 爬虫

本文链接：https://blog.csdn.net/zhaoyangjian724/article/details/83303533

版权

Python 爬虫专栏收录该内容

26 篇文章 33 订阅 ¥39.90 ¥99.00

订阅专栏

本文介绍如何使用JavaScript或Python解析HTML文档，专注于提取`<li>`标签的所有class值。通过DOM操作或正则表达式，你可以有效地获取这些信息，这对于网页数据抓取和网页自动化操作至关重要。

摘要由CSDN通过智能技术生成

# !/usr/bin/env python
# -*- coding: utf-8 -*-
from lxml import etree

# 获取文件元素
htmlEmt = etree.parse('test03.html')
# 获取所有的 <li> 标签
result = htmlEmt.xpath('//li/@class')
print result
print type(result)

<html><body><div>
    <ul>
         <li class="item-0">a01<a href="link1.html">first item</a></li>
         <li class="item-1">b02<a href="link2.html">second item</a></li>
         <li class="item-inactive">c03<a href="link3.html">third item</a></li>
         <li class="item-1">d04<a href="link4.html">fourth item</a></li>

了解本专栏