读书笔记:《Python3网络爬虫开发实战》——第2章:爬虫基础

第2章 爬虫基础

2.1 HTTP基本原理
2.1.1 URI和URL

URI: Uniform Resource Identifier 统一资源标识符
URL:Universal Resource Locator 统一资源定位符

2.1.2 超文本

hypertext

2.1.3 http和https

https:Hyper Text Transfer Protocol over Secure Socket Layer
https是以安全为目标的HTTP通道,简单地讲师HTTP的安全版,即HTTP下加入SSL层,简称为HTTPS

2.1.4 HTTP请求过程
2.1.5 请求
  1. 请求方法:get和post
  • get请求中的参数包含在URL中,数据可以在URL中看到;而post请求的URL不会包含这些数据,数据通过表单形式传输的,会包含在请求体中
  • get请求提交的数据最多只有1024字节,post无限制
  1. 请求的网址
    即URL
  2. 请求头
  3. 请求体
2.1.6 响应
  1. 相应状态码
  2. 响应头
  3. 响应体
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值