从零开始学python（十三）爬虫工程师自动化和抓包

爬完虫变成龙

已于 2023-07-31 16:47:45 修改

阅读量2.7k

点赞数 1

分类专栏： python开发 python python爬虫文章标签： python 爬虫自动化 python开发 selenium 抓包 Python爬虫

于 2023-07-31 16:42:17 首次发布

本文链接：https://blog.csdn.net/ch950401/article/details/132025562

版权

本文介绍了Python爬虫自动化和抓包的相关知识，包括Selenium的使用、pyppeteer采集、Charles抓包工具以及mitmproxy的脚本编写。Selenium可用于模拟浏览器行为，pyppeteer则提供了与无头Chrome交互的功能，Charles和mitmproxy则帮助抓包和分析网络请求。此外，文章还提供了学习路线和相关资源。

摘要由CSDN通过智能技术生成

前言

回顾之前讲述了python语法编程必修入门基础和网络编程，多线程/多进程/协程等方面的内容，后续讲到了数据库编程篇MySQL，Redis，MongoDB篇，和机器学习，全栈开发，数据分析，爬虫数据采集前面没看的也不用往前翻，系列文已经整理好了：

本系列文根据以下学习路线展开讲述，由于内容较多，：

从零开始学python到高级进阶路线图

适用于零基础学习和进阶人群的python资源：

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程（零基础-高级进阶JS逆向）
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档

自动化和抓包专题

一丶selenium采集

之前通过selenium实现过抢演唱会门票，感兴趣的可以看看
通过selenium自动化实现演唱会抢门票

Selenium是一种流行的自动化Web测试工具，它可以模拟人类用户在浏览器中的行为，适合用于构建自动化爬虫。本专题将介绍如何使用Selenium进行自动化爬取，并讲解如何通过抓包获取网页数据。

1.Selenium介绍

Selenium是一种开源的自动化测试工具，它可以模拟人类用户在浏览器中的行为，例如点击链接、填写表单、提交数据等等。Selenium支持多种编程语言的接口，包括Python、Java、JavaScript等等。对于爬虫工程师来说，使用Selenium可以方便地构建自动化爬虫，模拟人类用户在浏览器中的操作，从而获取数据。