- 分析网页结构是获取网络数据的前提,网页一般用超文本标记语言(Hyper Text Markup Language,简称:HTML)创建。HTML是描述网页的一种语言,使用标记标签来描述网页,其扩展名为.html
- HTML标签
HTML是用来描述网页的一种语言。- HTML不是一种编程语言,而是一种标记语言;标记语言是一套标记标签(markup tag)
- HTML使用标记标签来描述网页
- HTML文档包含了HTML标签及文本内容
- HTML文档也叫做web页面
- 实例解析
<!DOCTYPE html> <!--声明为HTML5文档-->
<html> <!--<html>元素是HTML页面的根元素-->
<head> <!--<head>元素包含了文档的元(metal)数据-->
<meta charset="utf-8"> <!--<meta>是html语言head区的一个辅助性标签-->
<title>HTML知识入门</title> <!--<title>元素描述了文档的标题-->
</head>
<body> <!--<body>元素包含了可见的页面内容-->
<h1>我的第一个标题</h1> <!--<h1>元素定义一个大标题-->
<p>我的第一个段落</p> <!--<p>元素定义一个段落-->
</body>
</html>
- 注意:html文件用UTF-8编码保存
<body>
<p>
每个表格从一个table标签开始。
每个表格行从tr标签开始。
每个表格的数据从td标签开始
</p>
<h4>一行三列:</h4>
<table border="1">
<tr>
<td>100</td>
<td>200</td>
<td>300</td>
</tr>
</table>
<h4>两行三列:</h4>
<table border="1">
<tr>
<td>100</td>
<td>200</td>
<td>300</td>
</tr>
<tr>
<td>400</td>
<td>500</td>
<td>600</td>
</tr>
</table>
</body>
-
由HTML创建的大学计算机网页案例网页网址为:http://112.25.158.3:8000/%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E9%A1%B5%E6%A1%88%E4%BE%8B.html ,在浏览器地址栏中输入网址就可以访问
-
运行在浏览器上的网页,可以由浏览器解析它的html文档,在浏览器的页面上点击键盘上的F12按键或点击鼠标选择查看源代码,均可以看到当前网页的html文档。
-
从该网页的源代码,会发现我们想要获取这个页面的内容,都可以在网页源代码中找到。而网络数据获取的主要工作原理,就是在网页源代码中把我们想要的内容抽取出来。
-
HTML语言是通过不同的标签来编写网页的,不同的标签对应着网页中不同的元素,有些标签之间可以嵌套,有些标签通过class属性来指定自己的类别,有些标签通过id属性来唯一标识自己,常用的有:
<div>标签,用来标识一块区域;
<p>标签,用于显示一段文字;
<h1><h2><h3>等标签,用于显示一个标题;
<a>标签,用于放置一个链接。<a>标签的href属性用于指定超链接目标的URL。
<li>标签是一个元素标签,属于列表标签。
知识点整理不易,如果对你有帮助,给个免费的赞支持一下吧!感谢阅读!