- 网站基础
1.1.1 html
1.1.2 http 协议
1.1.3 xpath
1.1.4 正则匹配
1.1 网站基础
1.1.1 html
在大数据时代,数据就是企业的命脉,而数据很多来源于各种各类的网站,因此,今天我们就先来了解一下网站的构成。
网站页面基本是由html和css组成,所以我们先来看一下html的基础知识。Html是用来描述网页的语言,但不是编程语言,而是标记语言。
如图所示:
这是一个网页html的基本结构,在爬虫中,经常看到的标签有:
<image>