python爬虫（8）之认识网页结构

最新推荐文章于 2024-07-12 16:27:40 发布

过度引用

最新推荐文章于 2024-07-12 16:27:40 发布

阅读量571

点赞数 10

分类专栏： python 文章标签：前端 javascript html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61885507/article/details/136661699

版权

python 专栏收录该内容

39 篇文章 0 订阅

订阅专栏

就以咱们csdn网站的结构来看看这些网页的基础内容

1、查看网页源代码

1、F12，或者右上角三个点找到更多工具里面有一个开发人员工具

之后点击左上角

你就能看见一个网页的源代码

当然你现抄是没法完全实现的

然后我们就以csdn的门面进行对网页结构进行认识

我们主要认识一下<body>里面的内容

1、<div>标签

他是干啥的为啥咱们这里会有这么多<div>

<div>标签就是块标签，将网页中规划出一块区域进行显示内容

下面我将用一些代码来进行演示：

<!DOCTYPE html>

<html>

<head>

<meta charset="utf-8">

<title>过度引用</title>

<style>

div{

background-color:pink;

display: inline-block;

width: 100px;

height:100px;

}</style>

</head>

<body>

<div>

</div>

</body>

</html>

这里的div 的格式完全可以按照自己的喜好进行设置大小背景色等等以及是否独占一行等等都是可以做到的

结果如下：

2、<ul> 标签<ol>标签 <li>标签

定义列表的元素当然在csdn的门户是用ul嵌套li做的也就是最上面的一列

现在我们来试试看去使用requests模块去爬取一下csdn

import requests

resp = requests.get(url='https://www.csdn.net')

print(resp.text)

结果如下：

其实就是把源代码给拿过来了

关于动态数据的加载等下次再说。

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
python爬虫（8）之认识网页结构

就以咱们csdn网站的结构来看看这些网页的基础内容。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

过度引用 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。