目录
一、了解网页结构
1、网页源代码
1、查看网页源代码以百度为例

按快捷键f12
然后点击

然后点击网页上任意位置
即可弹出网页源代码

2、解读网页源代码

1、<!DOCTYPE html> 用来告知 Web 浏览器页面使用了哪种 HTML 版本。
2、<html>定义一个 HTML 文档。
3、<head>定义关于文档的信息。
4、<meta>定义关于 HTML 文档的元信息。
5、<link>定义文档与外部资源的关系。
6、<title> 元素描述了文档的标题
7、<style>定义样式
8、<script>定义客户端脚本。

1、<body>元素包含了可见的页面内容。
2、<textarea> 标签定义一个多行的文本输入控件。
3、<div> 标签定义 HTML 文档中的一个分隔区块或者一个区域部分。常用于组合块级元素,以便通过 CSS 来对这些元素进行格式化。
二、requests模块使用方法
1、获取静态网页源代码
import requests #导入requests库
response=requests.get(url='https://www.baidu.com') #使用get()函数对指定的url发送请求,用resopnse储存接受到的请求
print(response.text)
<!--STATUS OK--><html> <head>
本文介绍了网页结构的基本概念,并通过实例详细解析了如何使用Python的requests模块获取静态和动态网页数据,包括查看网页源代码、获取豆瓣电影排行榜的数据,为Python爬虫学习者提供基础入门指南。
最低0.47元/天 解锁文章
3971

被折叠的 条评论
为什么被折叠?



