爬虫前导知识-Http请求与响应-NetWork怎么看-python爬虫知识点1

本文介绍了网络编程基础,重点讲解了HTTP请求与响应的组成、过程,以及HTTP方法。此外,还探讨了URL、请求方法的概念,详细解析了抓包工具NetWork的功能,包括其提供的各种信息。最后,简述了爬虫的基本概念、用途和Python爬虫的优势。
摘要由CSDN通过智能技术生成

一、网络编程基础

点这里

二、Http请求与响应

(一)HTTP通信组成

  • HTTP通信由两部分组成: 客户端请求消息 与 服务器响应消息
    在这里插入图片描述

(二)HTTP通信过程

(1) 当用户在浏览器的地址栏中输入一个URL并按回车键之后,浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为 Get 和 Post 两种方法。

  • 向url地址发出请求

(2) 当我们在浏览器输入URL=http://www.baidu.com 的时候,浏览器发送一个Request请求去获取 http://www.baidu.com 的html文件,服务器把Response文件对象发送回给浏览器。

  • 这个响应拿到的是网页的源代码,一个html源文件

(3) 浏览器分析Response中的 HTML,发现其中引用了很多其他文件,比如Images文件,CSS文件,JS文件。 浏览器会自动再次发送Request去获取图片,CSS文件,或者JS文件。当所有的文件都下载成功后,网页会根据HTML语法结构,完整的显示出来了。

(三)几个概念

url

  • 全球统一资源定位符
  • url当中的十六进制:在浏览器请求一个url,浏览器会对这个url进行一个编码。(除英文字母、数字和部分标识其他的全部使用% 加 十六进制码进行编码)
    • 例如 : https://tieba.baidu.com/f?ie=utf-8&kw=%E6%B5%B7%E8%B4%BC%E7%8E%8B&fr=search
      %E6%B5%B7%E8%B4%BC%E7%8E%8B = 海贼王
  • url实例: https://new.qq.com/omn/TWF20200/TWF2020032502924000.html
    • https::协议
    • new.qq.com:主机名
      以将主机理解为一台名叫 news.qq.com 的机器。这台主机在 qq.com 域名下
      port 端口号: 80 /new.qq.com 在他的后面有个 80 可以省略
    • TWF20200/TWF2020032502924000.html:访问资源的路径
    • #:anchor 锚点用前端在做页面定位的
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洋芋本人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值