python selenium 获取数据_python selenium 获取接口数据的实现

python selenium 获取接口数据。

selenium没有直接提供查询的函数,但是可以通过webdriver提供的API查询,使用的函数是Network.getResponseBody

Network.getResponseBody文档说明:

Network.getResponseBody的参数是requestid,requestid是webdriver每个请求自动生成的惟一ID,拿到requestid就能拿到请求返回的内容。

如何获取requestid?创建webdriver对象时配置信息设置获取performance,即可获取每个请求的日志信息,然后通过对日志信息的检索找到对应的requestid。

获取日志信息的webdriver创建代码(注意,必须传入配置信息才能获取日志信息):

from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

import time

caps = {

'browserName': 'chrome',

'loggingPrefs': {

'browser': 'ALL',

'driver': 'ALL',

'performance': 'ALL',

},

'goog:chromeOptions': {

'perfLoggingPrefs': {

'enableNetwork': True,

},

'w3c': False,

},

}

driver = webdriver.Chrome(desired_capabilities=caps)

driver.get('https://partner.oceanengine.com/union/media/login/')

# 必须等待一定的时间,不然会报错提示获取不到日志信息,因为絮叨等所有请求结束才能获取日志信息

time.sleep(3)

request_log = driver.get_log('performance')

for i in range(len(request_log)):

message = json.loads(request_log[i]['message'])

message = message['message']['params']

# .get() 方式获取是了避免字段不存在时报错

request = message.get('request')

if(request is None):

continue

url = request.get('url')

if(url == "https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json"):

# 得到requestId

print(message['requestId'])

# 通过requestId获取接口内容

content = driver.execute_cdp_cmd('Network.getResponseBody', {'requestId': message['requestId']})

print(content)

break

完整代码:

import json

from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

import time

caps = {

'browserName': 'chrome',

'loggingPrefs': {

'browser': 'ALL',

'driver': 'ALL',

'performance': 'ALL',

},

'goog:chromeOptions': {

'perfLoggingPrefs': {

'enableNetwork': True,

},

'w3c': False,

},

}

driver = webdriver.Chrome(desired_capabilities=caps)

driver.get('https://partner.oceanengine.com/union/media/login/')

# 必须等待一定的时间,不然会报错提示获取不到日志信息,因为絮叨等所有请求结束才能获取日志信息

time.sleep(3)

request_log = driver.get_log('performance')

print(request_log)

for i in range(len(request_log)):

message = json.loads(request_log[i]['message'])

message = message['message']['params']

# .get() 方式获取是了避免字段不存在时报错

request = message.get('request')

if(request is None):

continue

url = request.get('url')

if(url == "https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json"):

# 得到requestId

print(message['requestId'])

# 通过requestId获取接口内容

content = driver.execute_cdp_cmd('Network.getResponseBody', {'requestId': message['requestId']})

print(content)

break

到此这篇关于python selenium 获取接口数据的实现的文章就介绍到这了,更多相关python selenium 获取接口数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python Selenium 是一个功能强大的自动化测试工具,它可以模拟用户在浏览器中的行为,并且可以用来获取接口数据。要使用Python Selenium获取接口数据,可以按照以下步骤操作: 1. 安装Python Selenium库: 在命令行中运行`pip install selenium`,可以安装最新版本的Python Selenium库。 2. 下载并配置浏览器驱动: Selenium需要一个浏览器驱动来控制浏览器。根据自己使用的浏览器,下载对应的驱动并将其添加到系统的环境变量中。 3. 导入相关库和设置浏览器: 在Python脚本中导入Selenium库,并根据需要选择要使用的浏览器驱动,例如ChromeDriver。 示例代码如下: ```python from selenium import webdriver # 配置浏览器驱动 driver = webdriver.Chrome() ``` 4. 打开需要获取数据接口链接: 使用Selenium打开需要获取数据接口链接,可以使用`driver.get(url)`方法。 示例代码如下: ```python url = "https://api.example.com/data" driver.get(url) ``` 5. 获取接口数据: 一旦接口链接加载完成,可以使用`driver.page_source`属性获取页面的源代码。接口数据通常以JSON格式返回,你可以使用Python的JSON库来解析数据。 示例代码如下: ```python import json json_data = json.loads(driver.page_source) print(json_data) ``` 6. 关闭浏览器: 当你完成数据获取后,记得关闭浏览器驱动,以释放资源。 示例代码如下: ```python driver.quit() ``` 通过以上步骤,你可以使用Python Selenium获取接口数据。请记住,Selenium是一个强大的自动化测试工具,获取接口数据只是其众多功能之一。如果只是简单的获取接口数据,还有其他更轻量的库可以选择,比如Requests库。 ### 回答2: PythonSelenium库可以用于模拟浏览器操作,从而获取接口数据。下面是使用PythonSelenium获取接口数据的步骤: 1. 首先,需要安装PythonSelenium库。可以使用pip命令来安装,命令为:`pip install selenium`。 2. 在Python脚本中导入Selenium库和其他必要的库,例如:`from selenium import webdriver`。 3. 创建一个浏览器实例,例如使用Chrome浏览器:`driver = webdriver.Chrome()`。 4. 使用浏览器打开需要获取数据接口URL,可以使用`driver.get(url)`方法来实现。 5. 等待接口数据加载完成。如果接口是异步加载的,可能需要等待一段时间才能获取数据。可以使用`time.sleep()`方法进行等待。 6. 获取接口数据。可以使用Selenium提供的方法来查找页面元素并提取数据,例如使用`driver.find_element_by_xpath()`或`driver.find_element_by_css_selector()`方法来找到需要的元素。 7. 提取数据。一旦找到了需要的元素,可以使用元素的属性或方法来提取数据,例如使用`element.text`来获取元素的文本内容。 8. 关闭浏览器。使用`driver.quit()`方法来关闭浏览器。 以上就是使用PythonSelenium获取接口数据的基本步骤。根据接口的具体情况,可能需要进行一些额外的处理和逻辑来准确地获取到需要的数据。 ### 回答3: Python中可以使用Selenium获取接口数据Selenium是一个用于自动化浏览器操作的库,在这里我们可以利用它模拟浏览器访问接口获取数据。 首先,我们需要安装Selenium库。可以使用pip命令在命令行终端中执行以下命令进行安装: ``` pip install selenium ``` 安装完成后,需要安装一个浏览器驱动,根据所使用的浏览器型号和版本下载相应的驱动。例如,如果使用Chrome浏览器,可以下载ChromeDriver驱动。将驱动文件添加到系统环境变量中,或者将其放置在可执行文件所在的目录下。 接下来,我们可以编写Python代码来使用Selenium进行接口数据获取。首先,我们需要导入Selenium库和一些相关的模块: ```python from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By ``` 然后,我们可以创建一个浏览器实例,并打开目标接口页面: ```python chrome_options = Options() chrome_options.add_argument('--headless') # 通过无头模式运行浏览器,不打开显示界面 driver = webdriver.Chrome(options=chrome_options) driver.get('http://example.com/api') # 替换为目标接口的URL ``` 接下来,我们可以使用Selenium提供的方法来定位和解析接口数据。例如,可以通过标签名、类名或XPath表达式来定位页面元素并获取其文本内容: ```python element = driver.find_element(By.XPATH, '//div[@class="data"]') # 替换为目标接口数据所在元素的XPath表达式 data = element.text print(data) ``` 最后,别忘了在程序结束时关闭浏览器实例: ```python driver.quit() ``` 这样,我们就可以使用PythonSelenium获取接口数据了。但需要注意的是,使用Selenium获取接口数据可能会比直接使用requests等库效率低下,因为Selenium需要启动浏览器并加载页面。所以,如果接口数据比较简单且不需要解析动态生成的内容,最好还是使用requests等库进行接口调用和数据获取
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值