【爬虫学习预备】HTML清晰简明的基础入门

一、Web 浏览器与工作原理

Web浏览器(如谷歌浏览器,Internet Explorer,Firefox,Safari)是用于读取HTML文件,并将其作为网页显示。

浏览器工作原理
向浏览器中输入某个网址,浏览器回向服务器发出请求,然后服务器就会作出响应。其实,服务器返回给浏览器的这个结果就是HTML代码,浏览器会根据这个HTML代码将网页解析成平时我们看到的那样。

输入
发送请求
HTML代码
解析HTML代码
网址
浏览器
服务器
网页

二、HTML基础

2.1 什么是HTML?

HTML(Hyper Text Markup Language) 是一种超文本标记语言,是由一堆标记组成。网站服务器返回的响应内容一般都是以HTML文档为主, 浏览器中看到的网页内容就是浏览器HTML后的输出结果。

  • HTML 不是一种编程语言,而是一种标记语言
    标记语言是一套标记标签 (markup tag)
  • HTML 使用标记标签来描述网页
  • HTML 文档包含了HTML 标签文本内容
  • HTML文档也叫做 web 页面

2.2 HTML标签与元素

2.2.1 HTML 标签 (HTML tag)

1、定义

  • HTML 标签是由尖括号包围的关键词,比如
  • HTML 标签通常是成对出现的,比如
  • 标签对中的第一个标签是开始标签,第二个标签是结束标签
  • 开始和结束标签也被称为开放标签和闭合标签
<标签>内容</标签>

2、常用的HTML标签

标签描述
<a>定义超链接,从一个页面跳转到另一个页面
<div>定 义文档中的分区或节(drvision/section)
<h1>–<h6>定义标题,<h1>为最大标题,<h6>为最小标题
<ub>定义无序列表,内部列表项目用定义
<p>定义段落

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2.2 HTML元素

1、定义
从开始标签(start tag)到结束标签(end tag)之间所有代码

2、HTML元素的组成部分

  • 元素内容: 开始标签到结束标签之间的内容
  • 标签属性: 提供各种附加信息,大多数HTML标签都拥有属性
    在这里插入图片描述
    3、HTML的标签属性
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

2.3 HTML网页的两个部分

html网页般包含两个部分:

  • 文档头部(网页标题)
  • 文档主题(网页内容)
    HTML网页结构只有<body> 区域 (白色部分) 才会在浏览器中显示。

三、学习资源

慕课视频:Python数据爬取与可视化

https://www.icourse163.org/course/NHDX-1463126169

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值