网页数据的获取----网页的基本结构

  • 分析网页结构是获取网络数据的前提,网页一般用超文本标记语言(Hyper Text Markup Language,简称:HTML)创建。HTML是描述网页的一种语言,使用标记标签来描述网页,其扩展名为.html
  • HTML标签
    HTML是用来描述网页的一种语言。
    • HTML不是一种编程语言,而是一种标记语言;标记语言是一套标记标签(markup tag)
    • HTML使用标记标签来描述网页
    • HTML文档包含了HTML标签及文本内容
    • HTML文档也叫做web页面
  • 实例解析
<!DOCTYPE html>    <!--声明为HTML5文档-->
<html>    <!--<html>元素是HTML页面的根元素-->
<head>    <!--<head>元素包含了文档的元(metal)数据-->
<meta charset="utf-8">    <!--<meta>是html语言head区的一个辅助性标签-->
<title>HTML知识入门</title>    <!--<title>元素描述了文档的标题-->
</head>   
<body>    <!--<body>元素包含了可见的页面内容-->
<h1>我的第一个标题</h1>    <!--<h1>元素定义一个大标题-->
<p>我的第一个段落</p>    <!--<p>元素定义一个段落-->
</body>    
</html>    

黑框框是自己描的

  • 注意:html文件用UTF-8编码保存
<body>
<p>
每个表格从一个table标签开始。
每个表格行从tr标签开始。
每个表格的数据从td标签开始
</p>
<h4>一行三列:</h4>
<table border="1">
<tr>
 <td>100</td>
 <td>200</td>
 <td>300</td>
 </tr>
 </table>
 <h4>两行三列:</h4>
 <table border="1">
 <tr>
  <td>100</td>
  <td>200</td>
  <td>300</td>
 </tr>
 <tr>
  <td>400</td>
  <td>500</td>
  <td>600</td>
 </tr>
 </table>
 </body>

在这里插入图片描述

  • 由HTML创建的大学计算机网页案例网页网址为:http://112.25.158.3:8000/%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E9%A1%B5%E6%A1%88%E4%BE%8B.html ,在浏览器地址栏中输入网址就可以访问
    在这里插入图片描述

  • 运行在浏览器上的网页,可以由浏览器解析它的html文档,在浏览器的页面上点击键盘上的F12按键或点击鼠标选择查看源代码,均可以看到当前网页的html文档。
    在这里插入图片描述

  • 从该网页的源代码,会发现我们想要获取这个页面的内容,都可以在网页源代码中找到。而网络数据获取的主要工作原理,就是在网页源代码中把我们想要的内容抽取出来。

  • HTML语言是通过不同的标签来编写网页的,不同的标签对应着网页中不同的元素,有些标签之间可以嵌套,有些标签通过class属性来指定自己的类别,有些标签通过id属性来唯一标识自己,常用的有:

<div>标签,用来标识一块区域;
<p>标签,用于显示一段文字;
<h1><h2><h3>等标签,用于显示一个标题;
<a>标签,用于放置一个链接。<a>标签的href属性用于指定超链接目标的URL。
<li>标签是一个元素标签,属于列表标签。

知识点整理不易,如果对你有帮助,给个免费的赞支持一下吧!感谢阅读!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张同学啦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值