了解一些HTML5的基础知识和CSS基础知识有助于爬虫的学习,在学习这些基础知识之前,首先要安装HBuiderX工具。直接到官网下载标准版即可。
HTML基础
可以到HTML教程学习一下HTML基础知识。
超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。
打开HBuiderX工具,新建项目
在index.html中写入如下代码:
<!-- HTML:超文本标记语言 -->
<!-- HTML后缀名:.html / .htm -->
<!-- HTML标签名 -->
<!-- 一般标签:由起始标签和结束标签组成,可以插入其他标签或其他内容,例如:<h1>yyds</h1> -->
<!-- 自闭合标签:由起始标签组成,在起始标签末尾加斜杠,在其中间不能加任何东西例如:<br /> -->
<!-- HTML中标准是双引号 -->
<!-- HTML没有区分大小写 -->
<!-- 格式化代码:ctrl + k / 右键选择重排代码格式 -->
<!-- ! + tab键 自动生成初始代码-->
<!-- 声明此文档为HTML5文档 -->
<!DOCTYPE html>
<!-- 定义了HTML文档 -->
<html lang="zh">
<!-- 提供需要定义的信息 -->
<head>
<!-- 元信息 -->
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<meta http-equiv="X-UA-Compatible" content="ie=edge">
<!-- 定义标题名 -->
<title>HTML基础</title>
<link rel="stylesheet" type="text/css" href="css/style.css"/>
</head>
<!-- 在body标签写页面可见元素 -->
<body>
<!-- div:把不属于一类的标签间隔开 -->
<div class="a">
<!-- 标题标签:<h1>、<h2>、<h3>、<h4>、<h5>、<h6> -->
<h1 id="a">我是标题标签h1</h1>
<h2>我是标题标签h2</h2>
<h3>我是标题标签h3</h3>
<h4>我是标题标签h4</h4>
<h5>我是标题标签h5</h5>
<h6>我是标题标签h6