超文本标记语言,英文缩写:HTML(Hypertext Markup Language),它是一种结构化的标记语言,并非编程语言,主要起到的作用是来标记出网页中都有哪些载体组成,在网页中标记声明出各种形式的载体(如:文字、图片、音频、视频等)。
一、HTML元素组成及基本机构组成:
这些用来标记声明载体的元素统称为标签,它一般由开始标签(<标签>)和结束标签(<标签/>)组成,还有一种标签叫做单标签(<标签 />,例:<hr/>等),这些都为了声明载体和页面结构进行服务的。下面解读一HTML文件的书写构成:
<!DOCTYPE html>:声明本文档是HTML文档,让浏览器显示一个正确的网页
<html lang="en">:<html></html>整个页面的根元素,lang="en":设置网页语言,可将网站内容翻译成相应的语言,他的属性值包括:
- en:代表英文
- zh-CH:代表中文
- ja-jp:代表日文
<head></head>:又称为网页的头元素,它里面可以包含,网页的标题<title></title>、网页的编码格式<meta charset="utf-8">、还有网页中一些CSS和JS的引用等;
<title></title>:定义是的但进入网页后网站上所显示的名字;
<meta charset="utf-8">:帮助网页声明编码的显示规则,如不声明在一些浏览中会出现乱码,它的charset属性一般包括一下几个属性值:
- ASCII:美国信息交换标准代码
- ISO-8859-1:拉丁字母表的字符编码
- GB2212:汉字编码字符集
- UTF-8:万国码字符编码
<body></body>:又称为网页的身体元素,它里面包含了网页中的所有在网站中显示的元素;
二、常有的标签及基本属性:
1、段落标签:<p>文字段落</p>,段落与段落之间是有间距的;
2、锚点、超链接:<a>内容</a>,一般用来做超链接或进行页面定位,它的属性值包括:
- href:声明连接地址;
- title:鼠标悬停时提示信息;
- target:设置网页的显示位置,属性值包括:_blank(新窗口打开链接)、_parent(在父窗口中打开链接)、_self(默认,当前页面跳转);
- download:下载属性,下载链接的地址,它的值应与href的值相同;
- type:也就是目标文件的媒体类型。浏览器可以根据它来区分文件,然后决定什么内容用什么形式来显示;
等。
3、标题标签:
- 一级标签:<h1></h1>(H1标签在网页中最好只设置一个,网页爬虫中,首先抓的H1中的内容)
- 二级标签:<h2></h2>
- 三级标签:<h3></h3>
- 四级标签:<h4></h4>
- 五级标签:<h5></h5>
- 六级标签:<h6></h6>
4、斜体:
- <i></i>:斜体
- <em></em>:强调,倾斜,推荐使用
5、加粗:
- <b></b>:加粗
- <strong></strong>:强调文本,凸显内容,推荐使用
6、下划线:<u></u>
7、删除线:<s></s>、<del></del>
8、列表:
- <ol><li></li></ol>:有序列表
- <ul><li></li></ul>:无序列表
- <dl><dt><dd>dt下面可以有多个dd</dd></dt></dl>:描述列表,可以用于文图混排
有序列表属性:内联样式设置:type=“(属性值:1、a、A、i、I,)”
选择器设置:list-style-type:属性值;等设置
无序列表属性:内联样式设置:type=“(属性值:circle=空心圆、square=方形实心、none=无,取消显示)”
选择器设置:list-style-type:属性值;等设置
小总一下,大家多多练习,一起进步,耨耨了!