python | css选择器&xpath

本文介绍了Python中如何使用CSS选择器和XPath进行数据提取。CSS选择器包括标签选择器、类选择器、ID选择器、组合选择器、伪类选择器和属性提取器,而XPath主要关注数据匹配规则。文章通过实例详细讲解了各种选择器的使用方法,建议初学者使用CSS选择器,因其简洁易懂。
摘要由CSDN通过智能技术生成

css选择器和xpath都可以用于提取html文件,目的就是得到网页中有用的信息。诸如数据、图片

css选择器提取的对象是标签,xpath提取的对象是节点,两者的使用大同小异

下面对两者的应用作简单介绍,笔者推荐用css选择器,个人感觉更简洁。

1.CSS选择器

在 CSS 中,选择器是一种模式,用于选择具有指定属性的元素。

w3c指南:https://www.w3school.com.cn/cssref/css_selectors.ASP

选择器 例子 例子描述
.class .intro 选择 class=“intro” 的所有元素。
#id #firstname 选择 id=“firstname” 的所有元素。
* * 选择所有元素。
element p 选择所有 <p> 元素。
element,element div,p 选择所有 <div> 元素和所有 <p> 元素。
element element div p 选择 <div> 元素内部的所有<p>元素。
element>element div>p 选择父元素为 <div> 元素的所有 <p> 元素。
[attribute] [target] 选择带有 target 属性所有元素。
[attribute=value] [target=_blank] 选择 target="_blank" 的所有元素。

下面放出举例子用的html文件:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>这里是设置网页名称</title>
</head>
<style>
    p{
   
        color: #ff363f;
        font-size: 16px;
    }
    span{
   
        color: #e221ce;
        font-size: 28px;
    }
    div{
   
        color: #8dd4ff;
        font-size: 32px;
    }
    .main{
   
        color: black
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值