css选择器和xpath都可以用于提取html
文件,目的就是得到网页中有用的信息。诸如数据、图片
css选择器提取的对象是标签,xpath提取的对象是节点,两者的使用大同小异
下面对两者的应用作简单介绍,笔者推荐用css选择器,个人感觉更简洁。
1.CSS选择器
在 CSS 中,选择器是一种模式,用于选择具有指定属性的元素。
w3c指南:https://www.w3school.com.cn/cssref/css_selectors.ASP
选择器 | 例子 | 例子描述 |
---|---|---|
.class | .intro | 选择 class=“intro” 的所有元素。 |
#id | #firstname | 选择 id=“firstname” 的所有元素。 |
* | * | 选择所有元素。 |
element | p | 选择所有 <p> 元素。 |
element,element | div,p | 选择所有 <div> 元素和所有 <p> 元素。 |
element element | div p | 选择 <div> 元素内部的所有<p> 元素。 |
element>element | div>p | 选择父元素为 <div> 元素的所有 <p> 元素。 |
[attribute] | [target] | 选择带有 target 属性所有元素。 |
[attribute=value] | [target=_blank] | 选择 target="_blank" 的所有元素。 |
下面放出举例子用的html文件:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>这里是设置网页名称</title>
</head>
<style>
p{
color: #ff363f;
font-size: 16px;
}
span{
color: #e221ce;
font-size: 28px;
}
div{
color: #8dd4ff;
font-size: 32px;
}
.main{
color: black