1.HTML是个什么东西?
Hyper Text Markup Language(HTML)超文本标记语言,是用来描述网页的一种语言。
那么标记语言又是什么呢?标记语言就是把文本和文本以外的相关信息(例如大小,高度,颜色,位置等)组合在一起的语言
功能:用于网页的编写和修改。
我们学习html的阶段:看懂、修改、编写。
学习爬虫要掌握的html:看懂简单的html代码并学会修改、提取信息。
2. HTML的组成
<!DOCTYPE html>->全局声明,告诉浏览器处理的文件是html文件
<html>---------->html文件开始
<head>------>文档头开始
***网页头的具体内容***