python抓包检测入侵_Python爬虫实例动态ip+抓包+验证码自动识别

乃逸夫

于 2021-01-29 22:24:22 发布

阅读量522

点赞数

文章标签： python抓包检测入侵

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42488542/article/details/113513168

版权

最近出于某种不可描述的原因，需要爬一段数据，大概长这样：

是一个价格走势图，鼠标移到上面会显示某个时刻的价格，需要爬下来日期和价格。

第一步肯定先看源代码，找到了这样一段：

历史记录应该是从这个iframe发过来的，点进去看看，找到这样一段：

可以大概看出来是通过get一个json文件来获取数据，我们要的东西应该就在这个json里面。打开浏览器的开发者工具(F12)，一个个看发过来的json，发现这样一个：

打开看看：

ok，我们找到了想要的东西了，接下来分析下这个url，发现一些规律，可以直接从第一页的url构造出来这个的url，除了一个token...从源代码里找到这玩意长这样...

菜鸡如我当然不知所措了...只能模拟浏览器抓包了...加载完从这个frame的src里可以找到这个token，问题解决，开爬！

以上部分的代码如下：

#coding=utf8

importurllib.requestimportjsonimportrequestsimportrefrom selenium importwebdriverimporttimefrom bs4 importBeautifulSoupimportrequestsimportrandomimportpytzimportcv2from matplotlib importpyplot as pltfrom PIL importImage, ImageEnhanceimportpytesseractfrom selenium.webdriver.common.keys importKeysimportsysimportnumpy as npimportgcdefget_data_one_page(source, options, page):

key1= 'a href

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python抓包检测入侵_Python爬虫实例动态ip+抓包+验证码自动识别

最近出于某种不可描述的原因，需要爬一段数据，大概长这样：是一个价格走势图，鼠标移到上面会显示某个时刻的价格，需要爬下来日期和价格。第一步肯定先看源代码，找到了这样一段：历史记录应该是从这个iframe发过来的，点进去看看，找到这样一段：可以大概看出来是通过get一个json文件来获取数据，我们要的东西应该就在这个json里面。打开浏览器的开发者工具(F12)，一个个看发过来的json，发现这...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。