码农武:python基础,零基础

本文介绍了爬虫的基本概念,如其本质是通过Python编程实现网络请求并解析数据。详细讲解了网络七层架构模型,探讨了爬虫与Python的关系,合法性问题以及君子协议。同时剖析了浏览器的工作原理,区分了服务器端渲染和客户端渲染,强调了抓包工具的使用。
摘要由CSDN通过智能技术生成

爬虫课程安排

爬虫是什么?

爬虫-----程序

程序:通过复杂逻辑指令,实现功能。

程序运行的本质:通过代码,发送网络请求,得到响应,解析响应数据,解析需要的数据,供用户使用。

网络的工作原理

七层架构模型

应用层(准备数据),表示层(打包数据),会话层(和接收方建立对话),传输层(提供传输方式(TCP/UDP)),网络层(IP协议),数据链路层(数据转发),物理层(建立通路)

爬虫的应用场景:

爬虫和Python

爬虫合法吗?

君子协议:

开发工具:·

注意:把python添加到环境变量中

第一个爬虫程序:

具体实例:

获取百度网页数据日常手段:

爬虫手段:

通过编写程序,请求百度服务器,获取响应

爬虫----模拟浏览器访问网址的行为

第一个爬虫程序---通过编写程序,请求百度,获取内容

解释当前代码,解释编码方式

和百度网页的区别:

程序爬虫和浏览器显示的不一样

其实浏览器显示的也是这个样子

浏览器的工作原理:

五大主流浏览器

浏览器---内核,外壳

内核---渲染引擎,JS引擎

web请求全过程刨析

服务器端渲染:在服务器那边直接把数据和Html整合在一起,统一返回给浏览器

客户端渲染:第一次请求,只要一个html骨架,第二次请求拿到数据,进行数据展示,在页面源代码中看不到数据。

熟练使用浏览器抓包工具

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码农武

请付给老农种子化肥钱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值