python xpath 解析网页 应用实例

本文介绍了Python中使用XPath解析网页的实际应用,包括基础概念学习和实战案例展示。
摘要由CSDN通过智能技术生成

首先请阅读文档 http://www.runoob.com/xpath/xpath-tutorial.html ,这里有背景和概念的介绍。

下面展示一些实际中的应用。

一、准备:

from lxml import etree # 加载模块
 
html='''
<html>
    <head>
        <title>哈哈测试一下</title>
        <link type="text/css" rel="stylesheet" href="haha.css" />
        <link type="text/css" rel="stylesheet" href="haha1.css" />
        <link type="text/css" rel="stylesheet" href="haha2.css" />
        <script type="text/javascript" src="haha.js"></script>
        <script type="text/javascript" src="haha1.js"></script>
        <script type="text/javascript" src="haha2.js"></script>
    </head>
    <body>
        <div id="id1" class="class1">
            <div id="id2" class="class2">
                <ul class="cls_ul1">
                    <li class="cls_li1">
                        <div class="cls_3">
                            <span>span_text1</span>
                            <span>span_text2</span>
                            <i>text_1</i>
                        </div>
                        <div>
                            <a href="a_1.html">a_1</a>
                            <a href="a_2.html">a_2</a>
                            <a href="a_3.html">a_3</a>
                        </div>
                        <div class="cls_4">
                            <a href="a_4.html">
                                <img href="a_img1.jpg" />
                            </a>
                        </div>
                    </li>
                    <li class="cl
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值