HTML是什么
html是描述网页的一种语言,是超文本标记语言。它不是编程语言,而是标记语言。html使用标签标记描述网页。
HTML标签
html和/html标签限定了文档的开始点和结束点,该元素可以告知浏览器其自身是一个HTML文档。在html和/html之间是文档的头部和主体,文档的头部由head标签定义,而主体由body标签定义。
标签都是成对出现的,以<关键字>开始,以</关键字>结束。
注意,<!DOCTYPE>必须是HTML文档的第一行,位于html标签之前。
常用标签
-
html链接
<a href="网址">链接标题</a>
<a href="https://www.csdn.net">CSDN</a>
a标签表示html链接,herf指向链接的网址。 -
html标题
<h1>h1标题</h1>
<h2>h2标题</h2>
h1-h7标签可定义标题,h1定义最大的标题,h7定义最小的标题。h1,h2,…,h7作为标题标签,并且依据重要性递减。遵循这样的原则是很有必要的,它能让页面的层级关系更清楚,让搜索引擎更好地抓取和分析出页面的主题内容等。 -
html段落
<p>这是一个段落</p>
我们可以使用<p></p>
空一行,是排版更加好看,因此我们也可以在链接、图片标签外加上段落标签,达到空行的效果。
<p><a href="https://www.csdn.net">CSDN</a></p>
-
html图片
<img src="网址"/>
-
table标签
<table></table>
定义表格标签
<tr></tr>
定义一行,使用这个标签输入表格所有行的单元格。
<th></th>
定义表头,即第一行的单元格。
<td></td>
定义除表头之外的单元格。
<tr>
<th>Month</th>
<th>Savings</th>
</tr>
<tr>
<td>Jan.</td>
<td>$100</td>
</tr>
<tr>
<td>Feb.</td>
<td>$200</td>
</tr>
实际例子
<html>
<head>
<meta charset="utf-8">
</head>
<body>
<table border="1">
<caption>Caption</caption>
<tr>
<th>Month</th>
<th>Savings</th>
</tr>
<tr>
<td>Jan.</td>
<td>$100</td>
</tr>
<tr>
<td>Feb.</td>
<td>$200</td>
</tr>
<tr>
<td>May</td>
<td>$300</td>
</tr>
</table>
<p></p>
<h1>h1标题</h1>
<h2>h2标题</h2>
<p>这是一个段落</p>
<p><a href="https://www.csdn.net">CSDN</a></p>
<p><a href="#top">点击返回顶部</a></p>
</body>
</html>
网页显示
标签属性
属性是标签里键值对,对于爬虫来说常用的属性是id,name,class
- class
一个类包含若干个元素,但是一个元素可以同时属于多个类型。在选择某个类型的标签的时候可以利用class的名字一次选中所有这个class的标签。
- name
name为标签定义的名字 - id
id是标签定义的唯一标识符
CSS
css可译为“层叠样式表”或“级联样式表”,它定义如何显示HTML元素,用于控制Web页面的外观,使用方式如下:
可以存在于HTML的标签里<p style=""></p>
HTML里用专门的区块来定义<style></style>
以独立的.css文件存在。在<head>
里定义要引用的css文件<link rel="stylesheet" type="text/css" href="html_class.css">