码农武：python基础，零基础

最新推荐文章于 2024-08-13 18:29:56 发布

码农武

最新推荐文章于 2024-08-13 18:29:56 发布

阅读量404

点赞数 9

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54053713/article/details/135860879

版权

本文介绍了爬虫的基本概念，如其本质是通过Python编程实现网络请求并解析数据。详细讲解了网络七层架构模型，探讨了爬虫与Python的关系，合法性问题以及君子协议。同时剖析了浏览器的工作原理，区分了服务器端渲染和客户端渲染，强调了抓包工具的使用。

摘要由CSDN通过智能技术生成

爬虫课程安排

爬虫是什么？

爬虫-----程序

程序：通过复杂逻辑指令，实现功能。

程序运行的本质：通过代码，发送网络请求，得到响应，解析响应数据，解析需要的数据，供用户使用。

网络的工作原理

七层架构模型

应用层（准备数据），表示层（打包数据），会话层（和接收方建立对话），传输层（提供传输方式（TCP/UDP）），网络层(IP协议)，数据链路层（数据转发），物理层（建立通路）

爬虫的应用场景：

爬虫和Python

爬虫合法吗？

君子协议：

开发工具：·

注意：把python添加到环境变量中

第一个爬虫程序：

具体实例：

获取百度网页数据日常手段：

爬虫手段：

通过编写程序，请求百度服务器，获取响应

爬虫----模拟浏览器访问网址的行为

第一个爬虫程序---通过编写程序，请求百度，获取内容

解释当前代码，解释编码方式

和百度网页的区别：

程序爬虫和浏览器显示的不一样

其实浏览器显示的也是这个样子

浏览器的工作原理：

五大主流浏览器

浏览器---内核，外壳

内核---渲染引擎，JS引擎

web请求全过程刨析

服务器端渲染：在服务器那边直接把数据和Html整合在一起，统一返回给浏览器

客户端渲染：第一次请求，只要一个html骨架，第二次请求拿到数据，进行数据展示，在页面源代码中看不到数据。

熟练使用浏览器抓包工具

关注

9
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
1
评论
码农武：python基础，零基础

爬虫介绍，Python爬取百度首页小练习，基础，简单易懂
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码农武 请付给老农种子化肥钱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。