药监局数据的一些采集思路(2)

注:此方案适用于药监局所有使用了瑞数反爬方案的站点

最近几日对瑞数的脚本做了研究,弄了个更优雅的破解方案。

1、首先对脚本进行逆向分析,对加签部分进行hook处理。
2、chrome插件注入脚本js (包含websocket代码处理)
3、本地启动websocket服务(本人使用flask+flask_socketio)

就那么简单3步即可在本地拥有接口加签服务

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
药监局 selenium 是通过使用selenium库来获取药监管理局网站数据的方法之一。通过使用selenium库,可以模拟浏览器行为,实现自动化网页操作,从而获取所需的数据。在使用selenium进行数据获取时,通常需要先配置相应的浏览器驱动程序,然后通过指定驱动程序的路径来创建浏览器对象。接下来,可以使用浏览器对象执行一系列操作,如打开指定的网页、点击按钮、填写表单等,最后获取所需的数据。 对于使用selenium获取药监局网站数据的具体步骤和示例代码如下: 1. 安装selenium库和相应的浏览器驱动程序(如Firefox驱动程序)。 2. 导入selenium库和time模块。 3. 使用webdriver类创建浏览器对象,并指定浏览器驱动程序的路径。 4. 使用浏览器对象的get()方法打开目标网页。 5. 可选:使用time模块的sleep()方法等待页面加载完成。 6. 使用浏览器对象的find_element_by_XXX()方法定位到所需的元素。 7. 可选:使用浏览器对象的click()方法、send_keys()方法等操作元素。 8. 使用浏览器对象的page_source属性获取页面源代码。 9. 可选:使用浏览器对象的quit()方法关闭浏览器。 以下是一个示例代码,用于使用selenium获取药监局网站数据: import time from selenium import webdriver driver = webdriver.Firefox(executable_path='./driver/geckodriver.exe') driver.get("https://www.yaojiaju.cn/") time.sleep(2) html = driver.page_source print(html) driver.quit() 以上代码通过创建一个Firefox浏览器对象,打开了药监局网站,并获取了页面的源代码。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值