Python爬虫学习笔记一：爬虫，HTTP协议，抓包工具

最新推荐文章于 2024-06-02 20:58:59 发布

Mirst

最新推荐文章于 2024-06-02 20:58:59 发布

阅读量1.4k

点赞数 3

文章标签： python爬虫小白教程 HTTP协议抓包工具 Fiddler

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/W_H_M_2018/article/details/89417522

版权

1.爬虫概念

1.1什么是爬虫？

1.2哪些语言可以实现爬虫？

1.3爬虫分类

通用爬虫，聚焦爬虫

通用爬虫

通用爬虫如何获取新网站？

检索排名

robots.txt

聚焦爬虫

根据特定需求，抓取指定的数据。

概要

2.HTTP协议

双方规定的传输形式,应用层的协议.

ftp(21) http(80)\https(443) ssh(22) mysql(3306) redis(6379) momgo(27017)

2.1HTTP和HTTPS的区别

主要区别

公钥与私钥

2.2HTTP请求

请求行，若干消息头，实体内容。

请求行

get url地址附带，？之后，&连接，小于1k。

post 提交表单，数据量无限大。

消息头

X-Requested-With: ajax

2.3HTTP响应内容

状态行，若干消息头，实体内容

状态行

200 成功

300 重定向

400 禁止访问

500 服务器问题

请求消息头

3.Fiddler

抓包工具

3.1浏览器自带也有(Network)

3.2fiddler

1.配置

2.抓包

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。