学习目标:认识html,并了解其用处。
在之前的文章中,我们讲过html,今天我们来正式认识它。
一、html有什么用
作为构建网页的语言,html中有很多对爬虫有用的信息,所以我们需要了解它。
二、知道html是什么
Html,原名超文本标记语言,是适用于构件液面的一种web前端语言,我们看到的页面都是由html的代码写成的,而我们爬虫得到的网页源码也是html。
三、我们怎么利用html
这就要从html的结构说起:html主要由两部分组成:标签和文本,标签又分成单、双标签。双标签一般用于构建页面,将文本处理后显示在页面上,而单标签可以作为特殊文本显示在页面上,或者用于运行一些事情。
标签里可以提供一些参数,这些参数是对于我们来说,十分有利的,我们把他们找出来,可以作为一些信息使用。