3.Python网络爬虫—常用工具Fiddler的使用教程

3.Python网络爬虫—常用工具Fiddler的使用教程

前言

在这里插入图片描述

网络爬虫是一种自动获取网页内容的程序,在Python中,常用的网络爬虫工具主要包括Python编程语言、PyCharm集成开发环境(IDE)、浏览器和Fiddler。

Python是一种通用的编程语言,广泛用于网络爬虫的开发。它提供了丰富的库和模块,如Requests、BeautifulSoup和Scrapy,这些库可以帮助我们发送HTTP请求、解析HTML页面以及提取所需的数据。

PyCharm是一款流行的Python集成开发环境(IDE),它提供了代码编辑、调试和运行的功能,可以帮助开发者更高效地编写和管理Python代码,包括网络爬虫项目。

浏览器是访问网页的工具,常见的浏览器包括Chrome和火狐(Firefox)。在网络爬虫的开发过程中,我们可以使用浏览器手动检查网页的结构,调试和分析网络请求,这对于理解网页的数据结构和设计爬虫策略非常有帮助。

Fiddler是一款免费的网络调试工具,它可以捕获和分析HTTP请求和响应。通过Fiddler,我们可以模拟不同的请求头和参数,这有助于我们调试网络爬虫程序,查看和修改请求内容。

Fiddler的使用

操作界面

在这里插入图片描述

2.2 界面含义

请求 (Request) 部分详解

名称含义
Headers显示客户端发送到服务器的 HTTP 请求的,header 显示为一个分级视图,包含了 Web 客户端信息、Cookie、传输状态等
Textview显示 POST 请求的 body 部分为文本
WebForms显示请求的 GET 参数 和 POST body 内容
HexView用十六进制数据显示请求
Auth显示响应 header 中的 Proxy-Authorization(代理身份验证) 和 Authorization(授权) 信息
Raw将整个请求显示为纯文本
JSON显示JSON格式文件
XML如果请求的 body 是 XML格式,就是用分级的 XML 树来显示它

响应 (Response) 部分详解

名称含义
Transformer显示响应的编码信息
Headers用分级视图显示响应的 header
TextView使用文本显示相应的 body
ImageVies如果请求是图片资源,显示响应的图片
HexView用十六进制数据显示响应
WebView响应在 Web 浏览器中的预览效果
Auth显示响应 header 中的 Proxy-Authorization(代理身份验证) 和 Authorization(授权) 信息
Caching显示此请求的缓存信息
Privacy显示此请求的私密 (P3P) 信息
Raw将整个响应显示为纯文本
JSON显示JSON格式文件
XML如果响应的 body 是 XML 格式,就是用分级的 XML 树来显示它

2.3 设置

2.3.1 如何打开

启动Fiddler,打开菜单栏中的 Tools >Options,打开“Fiddler Options”对话框
在这里插入图片描述

2.3.2 设置

在这里插入图片描述

  • Capture HTTPS CONNECTs 捕捉HTTPS连接
  • Decrypt HTTPS traffic 解密HTTPS通信
  • Ignore server certificate errors 忽略服务器证书错误
  • all processes 所有进程
  • browsers onlye 仅浏览器
  • nono- browsers only 仅非浏览器
  • remote clients only 仅远程链接

在这里插入图片描述
Trust Root Certificate(受信任的根证书) 配置Windows信任这个根证书解决安全警告
在这里插入图片描述

  • Allow remote computers to connect 允许远程连接
  • Act as system proxy on startup 作为系统启动代理
  • resuse client connections 重用客户端链接
  • 11
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值