使用Selenium控制已打开的浏览器和网页
之前遇到一个需求,就是需要登录某一个网站然后需要通过selenium从网页上自动获取一些信息;该网站需要通过手机验证码登录,通过selenium自动化登录网页固然可以,但是终究还是需要手动输入手机验证码,所以不如在自动获取信息之前,我们先手动登录网站;即我们后续的操作都在一个已打开的浏览器上操作;
我们可以使用Chrome DevTools协议,使用selenium控制已打开的浏览器,它允许客户检查和调试Chrome浏览器;
首先右击Chrome浏览器,打开“属性”,选择快捷方式Tab页,然后在目标原有内容之后添加如下内容:
[--headless] --remote-debugging-port=9222 --user-data-dir="D:\Chrome"
添加后完整的内容为:
"C:\Program Files\Google\Chrome\Application\chrome.exe" [--headless] --remote-debugging-port=9222 --user-data-dir="D:\Chrome"
打开cmd,在命令行中输入如下命令,先进入chrome.exe存放的文件目录,然后打开chrome浏览器:
-
cd C:\Program Files\Google\Chrome\Application\
-
chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"
当然,也可以直接先在环境变量的path中配置好chrome.exe路径, 之后可以直接执行chrome.exe xxx 命令;
然后运行如下python代码即可打开你想要打开的网站,并进行一些操作;下面是一个打开网站的例子:
from selenium.webdriver.chrome.options import Options
from selenium import webdriver
from time import sleep
# 导入按钮
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
load_wait_short = 2
load_wait_middle = 4
load_wait_long = 6
#C:\Users\ADMIN\AppData\Local\Google\Chrome\Application>chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"
def getChromeBrowser():
chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
chrome_driver = r"H:\sore\pythont\chromedriver.exe"
browser = webdriver.Chrome(chrome_driver, options=chrome_options)
return browser
def openBrowserWebsite(url):
browser = getChromeBrowser()
browser.get(url)
browser.implicitly_wait(load_wait_short)
print('web title:', end='')
print(browser.title)
for i in range(10000): # 刷新次数
print(i)
sleep(15) # 五秒一次
browser.refresh() # 刷新网页
#above = browser.find_element_by_link_text("重新推送")
#btn = browser.find_element_by_css_selector('div.title > button.ant-btn ant-btn-primary')
#https://blog.csdn.net/weixin_43775400/article/details/121623860
browser.find_element_by_xpath('//*[@id="rc-tabs-0-panel-2"]/div/div/div[1]/div[1]/button').click()
btn=browser.find_element_by_xpath('//*[@id="rc-tabs-0-panel-2"]/div/div/div[1]/div[2]/div/form/div[5]/div[3]/div[3]')
btn.click()
#btn = driver.find_element_by_css_selector('div.ant-popover-buttons')
#print(btn.text, ':', btn.get_property('ant-btn ant-btn-primary ant-btn-sm'))
#btn.click()
print(browser.title)
if __name__ == '__main__':
openBrowserWebsite(url='https://open-dev.dingtalk.com/v1/fe/old#/appMgr/provider/h5/69841/2')
如果后面需要在打开的浏览器上操作,即可按上述做法举一反三进行操作,大同小异;比如我们可以在这个打开的浏览器上登录网站,然后再通过selenium自动获取数据;