python网络爬虫教程(二):最通俗易懂的网页基础教程

本文是Python网络爬虫教程的第二部分,主要讲解网页的组成:HTML、CSS和JavaScript,以及爬虫的基本原理——发起请求、获取响应、解析内容和保存数据。通过实例介绍HTML标签和CSS样式,阐述JavaScript在网页交互中的作用。
摘要由CSDN通过智能技术生成

上一章我们介绍了网络基础,详情可点击如下链接python网络爬虫教程(一),了解了HTTP的基本原理以及浏览器与服务器之间的收发机制,本章我们就来学习网页基础,了解网络的组成和结构等内容。

网页的组成

网页可以分为三大部分:HTML、CSS和javaScript。如果把网页比作一个人的话,HTML就相当于骨架,javaScript相当于肌肉,CSS相当于皮肤。三者结合起来才能形成一个完整的网页。

1. HTML

HTML是用来描述网页的一种语言,其全称叫做作Hyper Text Markup Language,翻译过来就是超文本标记语言。HTML是一种标签语言,我们可以通过一个简单的例子来直观感受一个什么是HTML,在桌面上新建一个文本文件,复制以下内容到文件中,并将文件后缀改为”.html“

<!DOCTYPE html>
<html>
<head>
<meta charset="gbk">
<title>我的第一个 HTML 页面</title>
</head>

<body
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值