沭阳学爬虫02Web网页基础

Web网页基础

当我们用浏览器访问网站时,页面各不相同,为什么呢?

本节学习网页的基本组成、结构和节点

网页的组成

网页可以分为三大部分:

  • HTML
  • CSS
  • JavaScript

把网页比作一个人的话

  • HTML相当于骨架
  • JavaScript相当于肌肉
  • CSS相当于皮肤
HTML

是用来描述网页的一种语言

全称叫作Hyper Text Markup Language

超文本标记语言

我们浏览的网页包括文字、按钮、图片和视频等各种复杂的元素

期基础架构就是HTML

不同类型的元素通过不同类型的标签来表示

  • 图片用img标签来表示

  • 视频用video标签表示

  • 段落用p标签表示

  • 它们之间的布局又常通过布局标签div嵌套组合而成

    各种标签通过不同的排列和嵌套就可以形成网页的框架

CSS

虽然HTML定义了网页的结构

但是只有HTML页面的布局并不美观

可能只是简单节点元素的排列

为了让网页看起来更好看一些,就需要借助CSS

Cascading Style Sheets,即层叠样式表

  • “层叠”是指当在HTML中引用了数个样式文件并且样式发生冲突时,浏览器能根据层叠顺序处理

  • “样式“是指网页中文字大小、颜色、元素间距、排列等格式

CSS是目前惟一的网页页面排版样式标准


#head_wrapper.s-ps-islite.s-p-top{
    position:absolute;
    bottom:40px;
    width:100%;
    height:181px;
}

大括号前面是一个CSS选择器

首先选中id为head_wrapper且class为s-ps-islite的节点

然后再选中其内部的class为s-p-top的节点


大括号内部写的就是一条条样式规则

  • position指定了这个元素的布局方式为绝对布局
  • bottom指定元素的下边距为40像素
  • width指定了宽度为100%占满父元素
  • height指定了元素的高度

我们将位置、高度、宽度等样式配置统一写成这样的形式

然后用大括号括起来,接着在开头加上CSS选择器

这就代表这个样式对CSS选择器选中的元素生效

元素就会根据此样式来展示


网页中,一般会统一定义整个网页的样式规则 并写入CSS文件(.css)中

HTML中,只需要用link标签即可引入写好的CSS文件

这样整个页面就会变得美观、优雅

JavaScript

JS,是一种脚本语言

HTML和CSS配合使用,提供给用户的只是一种静态信息,缺乏交互性

我们在网页里可能会看到一些交互和动画效果

  • 下载进度条、提示框、轮播图等

通常就是利用JavaScript

使得用户与信息之间不只是一种浏览与显示的关系

而是实现了一种实时、动态、交互的页面功能


JavaScript通常也是以单独的文件形式加载的,后缀js

在HTML中通过script标签即可引入

<script src="jquery-2.1.0.js"></script>

HTML定义了网页的内容和结构

CSS描述了网页的布局

JavaScript定义了网页的行为


网页的结构

<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>This is a Demo</title>
</head>
<body>
<div id="container">
<div class="wrapper">
<h2 class="title">Hello World</h2>
<p class="text">Hello, this is a paragraph.</p>
</div>
</div>
</body>
</html>

开头用DOCTYPE定义了文档类型

最外层是html标签,最后还有对应的结束标签来表示闭合

其内部是head标签和body标签,分别代表网页头和网页体

同样,它们也需要结束标签


head标签内定义了一些页面的配置和引用

  • < mete charset=“UTF-8” > 它指定了网页的编码为UTF-8
  • title标签则定义了网页的标题,会显示在网页的选项卡中,不会显示在正文中

body标签内则是在网页正文中现实的内容


div标签定义了网页的区块,它的id是container,这是一个非常常用的属性

且id的内容在网页中是唯一的,我们可以通过它来获取这个区块

然后在此区块内又有一个div标签,它的class为wrapper

这也是一个非常常用的属性,经常与CSS配合使用来设定样式


一个网页的标准形式

  • HTML标签内嵌套head 和body标签
  • head内定义网页的配置和引用
  • body内定义网页的正文

节点树以及节点间的关系

在HTML中,所有标签定义的内容都是节点

它们构成了一个HTML DOM树

DOM是W3C(万维网联盟)的标准,Document Object Model

文档对象模型

定义了访问HTML、XML文档的标准

  • W3C文档对象模型(DOM)是中立于平台和语言的接口

    它允许程序和脚本动态访问和更新文档的内容、结构、样式


W3C DOM 标准被分为3个不同的部分:

  • 核心 DOM :针对任何结构化文档的标准模型
  • XML DOM : 针对XML文档的标准模型
  • HTML DOM :针对HTML文档的标准模型

根据W3C的HTML DOM 标准,HTML文档中的所有内容都是节点

  • 整个文档是一个文档节点
  • 每个HTML元素是元素节点
  • HTML元素内的文本是文本节点
  • 每个HTML属性是属性节点
  • 注释是注释节点

HTML DOM 将HTML文档视作树结构,这种结构被称为节点树

通过HTML DOM

树中的所有节点均可通过JavaScript访问

所有HTML节点元素均可被修改

也可被创建或删除


节点树中的节点彼此拥有层级关系

常用父(parent)、子(child) 、兄弟(sibling)等术语描述

父节点拥有子节点,同级的子节点被称为兄弟节点

顶端的节点成为根(root)

除根节点外,每个节点都有父节点

同时可以拥有任意数量的子节点或兄弟节点

DOM更多详情参考文档http://www.w3school.com.cn/htmldom/dom_nodes.asp


选择器

网页由一个个节点组成

CSS选择器会根据不同节点来设置不同的样式规则

如何定位节点呢?

在CSS中,我们使用CSS选择器来定位节点

<div id='container'>

表示为 #container

#开头代表选择id,其后紧跟id的名称

<div class='wrapper'>

表示为 .wrapper

.开头代表选择class,其后紧跟class的名称

<h2></h2>

根据标签名筛选,如果想选择二级标题,直接用h2即可

这是最常用的 3 种表示,分别是根据 id、class、标签名筛选


此外,CSS选择器还支持嵌套选择

各个选择器之间加上空格分隔开便可以代表嵌套关系(层级选择器)

div p

只有div中的p标签才有这个属性

加逗号,代表并列关系(组合选择器)

div,p

div和p属性都有这个属性


CSS选择器其他语法规则

选 择 器例  子例子描述
.class.intro选择 class=“intro” 的所有节点
#id#firstname选择 id=“firstname” 的所有节点
**选择所有节点
elementp选择所有 p 节点
element,elementdiv,p选择所有 div 节点和所有 p 节点
element elementdiv p选择 div 节点内部的所有 p 节点
element>elementdiv>p选择父节点为 div 节点的所有 p 节点
element+elementdiv+p选择紧接在 div 节点之后的所有 p 节点
[attribute][target]选择带有 target 属性的所有节点
[attribute=value][target=blank]选择 target=“blank” 的所有节点
[attribute~=value][title~=flower]选择 title 属性包含单词 flower 的所有节点
:linka:link选择所有未被访问的链接
:visiteda:visited选择所有已被访问的链接
:activea:active选择活动链接
:hovera:hover选择鼠标指针位于其上的链接
:focusinput:focus选择获得焦点的 input 节点
:first-letterp:first-letter选择每个 p 节点的首字母
:first-linep:first-line选择每个 p 节点的首行
:first-childp:first-child选择属于父节点的第一个子节点的所有 p 节点
:beforep:before在每个 p 节点的内容之前插入内容
:afterp:after在每个 p 节点的内容之后插入内容
:lang(language)p:lang选择带有以 it 开头的 lang 属性值的所有 p 节点
element1~element2p~ul选择前面有 p 节点的所有 ul 节点
[attribute^=value]a[src^=“https”]选择其 src 属性值以 https 开头的所有 a 节点
[attribute$=value]a[src$=".pdf"]选择其 src 属性以.pdf 结尾的所有 a 节点
[attribute*=value]a[src*=“abc”]选择其 src 属性中包含 abc 子串的所有 a 节点
:first-of-typep:first-of-type选择属于其父节点的首个 p 节点的所有 p 节点
:last-of-typep:last-of-type选择属于其父节点的最后 p 节点的所有 p 节点
:only-of-typep:only-of-type选择属于其父节点唯一的 p 节点的所有 p 节点
:only-childp:only-child选择属于其父节点的唯一子节点的所有 p 节点
:nth-child(n)p:nth-child选择属于其父节点的第二个子节点的所有 p 节点
:nth-last-child(n)p:nth-last-child同上,从最后一个子节点开始计数
:nth-of-type(n)p:nth-of-type选择属于其父节点第二个 p 节点的所有 p 节点
:nth-last-of-type(n)p:nth-last-of-type同上,但是从最后一个子节点开始计数
:last-childp:last-child选择属于其父节点最后一个子节点的所有 p 节点
:root:root选择文档的根节点
:emptyp:empty选择没有子节点的所有 p 节点(包括文本节点)
:target#news:target选择当前活动的 #news 节点
:enabledinput:enabled选择每个启用的 input 节点
:disabledinput:disabled选择每个禁用的 input 节点
:checkedinput:checked选择每个被选中的 input 节点
:not(selector):not选择非 p 节点的所有节点
::selection::selection选择被用户选取的节点部分
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值