爬虫入门02 web网页基础

本文基于各个大佬的文章


前言

暑假在家闲来无事,网上冲浪刷到了爬虫教程,目前正在学习中。本文即记录所学内容。


提示:以下是本篇文章正文内容,下面案例可供参考

一、网页是什么?

网页是构成网站的基本元素是承载各种网站应用的平台。那么这时我们便有疑问,网站是什么?网站是有独立域名、独立存放空间的内容集合,这些内容可能是网页,也可能是程序或其他文件,不一定要有很多网页,主要有独立域名和空间,那怕只有一个页面也叫网站。

而网页主要由文字、图像、超链接等元素组成,除此之外还包括视频、音频、flash等。例如blog、挂在别人那里的个人主页,企业建站系统里的企业页面,多用户商城里的商户……尽管有很多页面,功能也齐全,但都不能叫网站,只能叫网页。

明白网站是由网页组成的之后,我们再来看网页的基本组成:结构(HTML)、表现(CSS)和行(JavaScript)。例如blog、挂在别人那里的个人主页,企业建站系统里的企业页面,多用户商城里的商户……尽管有很多页面,功能也齐全,但都不能叫网站。

1.HTML

HTML 是用来描述网页的一种语言,其全称叫作 Hyper Text Markup Language,即超文本标记语言。我们浏览的网页包括文字、按钮、图片和视频等各种复杂的元素,其基础架构就是 HTML。

不同类型的元素通过不同类型的标签来表示,如图片用 img 标签表示,视频用 video 标签表示,段落用 p 标签表示,它们之间的布局又常通过布局标签 div 嵌套组合而成,各种标签通过不同的排列和嵌套就可以形成网页的框架。

2.CSS

CSS全称叫作 Cascading Style Sheets,即层叠样式表。“层叠” 是指当在 HTML 中引用了数个样式文件,并且样式发生冲突时,浏览器能依据层叠顺序处理。“样式” 指网页中文字大小、颜色、元素间距、排列等格式。

CSS 是目前唯一的网页页面排版样式标准,有了它的帮助,页面才会变得更为美观。大括号内部写的就是一条条样式规则,例如 position 指定了这个元素的布局方式为绝对布局,bottom 指定元素的下边距为 40 像素,width 指定了宽度为 100% 占满父元素,height 则指定了元素的高度。

我们将位置、宽度、高度等样式配置统一写规定的形式,然后用大括号括起来,接着在开头再加上 CSS 选择器,这就代表这个样式对 CSS 选择器选中的元素生效,元素就会根据此样式来展示了。在网页中,一般会统一定义整个网页的样式规则,并写入 CSS 文件中(其后缀为 css)。

例如百度图标。

3.JavaScript

JavaScript是一种属于网络的高级脚本语言,已经被广泛用于Web应用开发,常用来为网页添加各式各样的动态功能,为用户提供更流畅美观的浏览效果。HTML 和 CSS 配合使用,提供给用户的只是一种静态信息,缺乏交互性,加入JS后网页里会看到一些交互和动画效果,如下载进度条、提示框、轮播图等。通常JavaScript脚本是通过嵌入在HTML中来实现自身的功能的。

二、网页结构

我们还是以百度为例,图中截取部分HTML。

开头用 首先DOCTYPE 定义了文档类型,其次最外层是 html 标签,最后还有对应的结束标签来表示闭合,其内部是 head 标签和 body 标签,分别代表网页头和网页体,它们也需要结束标签。

head 标签内定义了一些页面的配置和引用,如:<meta charset="UTF-8">,它指定了网页的编码为 UTF-8。title 标签则定义了网页的标题,会显示在网页的选项卡中,不会显示在正文中。

body 标签内则是在网页正文中显示的内容。div 标签定义了网页中的区块,它的 id 是 container,这是一个非常常用的属性,且 id 的内容在网页中是唯一的,我们可以通过它来获取这个区块。然后在此区块内又有一个 div 标签。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值