一、HTML
什么是 HTML?
HTML 是用来描述网页的一种语言。
- HTML 指的是超文本标记语言 (Hyper Text Markup Language) ;
- HTML 不是一种编程语言,而是一种标记语言 (markup language)
- 标记语言是一套标记标签 (markup tag)
- HTML 使用标记标签来描述网页
HTML 标签
HTML 标记标签通常被称为 HTML 标签 (HTML tag)。
- HTML 标签是由尖括号包围的关键词,比如
- HTML 标签通常是成对出现的,比如 和
- 标签对中的第一个标签是开始标签,第二个标签是结束标签
- 开始和结束标签也被称为开放标签和闭合标签
HTML 文档 = 网页
- HTML 文档描述网页
- HTML 文档包含 HTML 标签和纯文本 HTML
- 文档也被称为网页
二、引子
下面这段代码是通过 IDEA 2016 系统自动创建的代码:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
</body>
</html>
三、HTML结构树
四、分析
DOCTYPE
相当于linux脚本前的#!/bin/bash, DOCTYPE用来告诉浏览器使用什么规范来解释代码。 常用的有HTML 、 XHTML。
这个属性会被浏览器识别并使用,compatMode默认是BackCompat。如果没有,浏览器按照自己的方式解析渲染页面,在不同的浏览器就会显示不同的样式。如果添加了,那么各个厂商的浏览器就会按照W3C的标准解析渲染页面,这样页面内容就不会因为浏览器不同而出现素材渲染不同的情况。
lang
设置页面的语言属性,这里设置了lang=en,这样谷歌在加载页面时就会提示是否翻译,这是html5的写法
charset
设置html文件使用的字符集
< html> < html/>(标签)
由“一套尖括号+标签名”组成html:超文本标记语言,类似于xml、xhtml,是通过一个个成对的标签来进行配对,实现属性的配置,并将标签里的属性作用于被标记的内容上。
一个完整的html一般分为三部分:
- < html> content < html/>:项目标签,一个html里包含首尾,范围最大的一个标签,其中标记着整个头部标签、内容标签
- < head>content < head/>: 头部标签,用于页面布局
- < body>content < body/>: 内容标签,页面的大部分内容都在此处编写
标签根据闭合形势分为:
- 自闭和标签
例如 < br /> 只有一套加括号,标签不成对出现; - 非自闭和标签
例如 < p> content < p/> 由两套尖括号组成,标签成对出现;
根据标签属性作用域的不同又可以分为:
- 块级标签
例如< div> content< div/> 作用域为中间内容所占的整行; - 内联标签
例如< span> content< span/>作用域为中间内容本身所占的位置;
注释
html的代码注释方式,其实是一个特殊的自闭和标签:
完整的形势为
<!-- 注释内容 --/>