selenium来写自动化远程教育

最新推荐文章于 2023-07-12 10:06:26 发布

yjxtor

最新推荐文章于 2023-07-12 10:06:26 发布

阅读量1.1k

点赞数

文章标签： python selenium

本文链接：https://blog.csdn.net/yjxtor/article/details/109386396

版权

selenium来写自动化远程教育

一、利用webdriver来启动chrome,这里涉及webdriver的安装。

1.安装的webdriver需要和chrome的版本对应，并且要设置环境变量。

2.启动参数，chrome_options = Options()，有时候会崩溃，要使用–no-sandbox参数，options参数很多。可以百度一下学习。

3.如果想获取chrome的network和console参数，还要设置

self.browser = webdriver.Chrome(options=chrome_option,desired_capabilities=capabilities)

直接用performance来获取
根据Chrome驱动程序75的发行说明中的规定，功能loggingPrefs已重命名为goog:loggingPrefs ，这是W3C标准所要求的。因此，设置功能的代码应该进行调整，至少由于日志捕获原因，没有必要退回到非w3c模式。

d[‘goog:loggingPrefs’] = { ‘performance’:‘ALL’ }

chrome 75及其chromedriver存在相同的问题，将“ w3c”设置为False可解决此问题：


from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium.webdriver.chrome.options import Options

d = DesiredCapabilities.CHROME
d['loggingPrefs'] = { 'performance':'ALL' }

chrome_options = Options()
chrome_options.add_experimental_option('w3c', False)

    #caps = webdriver.DesiredCapabilities().CHROME
  #     caps = {
    #     'browserName': 'chrome',
    #     'goog:loggingPrefs': {  --这个参数是个坑，上面有解释。
    #         'browser': 'ALL',
    #         'driver': 'ALL',
    #         'performance': 'ALL',
    #     },
    #     'goog:chromeOptions': {
    #         'perfLoggingPrefs': {
    #             'enableNetwork': True,
    #         },
    #         'w3c': False,
    #     },
    # }
driver = webdriver.Chrome(desired_capabilities=d, options=chrome_options)
、

4.日志比较大，请参照performance.json,checkwatch.json（）二个文件了解结果再作分析。

5.能取得network的request，可是日志没办法取得返回的结果，这个时候可以变通一下，利用日志把request的headers记录下来，用request库来
模拟一次发包就可以拿到response的内容。要取什么东西用chrome的network调试一下，拿到ajax运行的js文件。在开发者界面resource里面，分析一下js文件，就清楚了他会发送什么包。

二、模拟登录的验证码问题

1.利用tensorflow来分析验证码，人工智能分析。安装tensorflow非常多坑。其实打码网站简单，可是都要钱。

2.安装tnesorflow太多坑，参照tensorflow安装笔记。

三、chrome设置flash的问题，因为chrome不支持flash播放，要设置后才能观看，好多网站还是用flash播放视频的。

本以为很简单，打开页面直接找到按键设置就是了，可是这些chrome的设置界面全是shadow-root,全是隐藏起来的。

    #显示shadow-roo层
    def expand_root_element(self, element):
        return self.browser.execute_script("return arguments[0].shadowRoot", element)
		setchromeflash.py

# -*- coding: utf-8 -*-

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select

class chromeDriver():

    def __init__(self, driver = ''):
        # 设置窗口大小
        self.window_width  = 1680
        self.window_height = 948
        # 设置 chromedriver 位置
        self.executable_path = r"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe"
        # 设置 Flash 的路径
        self.flash_path     = ''
        # 获取 driver
        if driver: self.driver = driver
        else:
            self.driver = self.get_chrome_driver()
        

    def get_chrome_driver(self):
        # 头部
        user_agent         = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
        # 创建参数对象
        options         = webdriver.ChromeOptions()

        prefs = {
            # 开启图片
            "profile.managed_default_content_settings.images":1,
            # 关闭 Notification
            "profile.default_content_setting_values.notifications": 2,
        }

        # 设置 Flash 的路径
        options.add_argument('--ppapi-flash-version=32.0.0.171')
        options.add_argument('--ppapi-flash-path=' + self.flash_path)
        options.add_argument('binary_location=/Applications/Google Chrome.app/Contents/MacOS/Google Chrome')
        # 指定屏幕分辨率
        options.add_argument('window-size=' + str(self.window_width) + 'x' + str(self.window_height) + '\'')
        # 最大化窗口
        options.add_argument('--start-maximized')
        # 规避bug
        options.add_argument('--disable-gpu')
        # 禁用弹出拦截
        options.add_argument('--disable-popup-blocking')
        # 隐藏自动软件
        options.add_argument('disable-infobars')
        # 设置中文
        options.add_argument('lang=zh_CN.UTF-8')
        #忽略 Chrome 浏览器证书错误报警提示
        options.add_argument('--ignore-certificate-errors')
        # 更换头部
        options.add_argument('user-agent=' + user_agent)
        options.add_argument('no-default-browser-check')
        # 关闭特征变量
        options.add_experimental_option('excludeSwitches', ['enable-automation'])
        options.add_experimental_option('prefs', prefs)
        # 创建 Chrome 对象
        driver     = webdriver.Chrome(options = options)

        return driver

    def get(self, web_url):
        if not web_url: return False
        return     self.driver.get(web_url)

    def add_flash_site(self, web_url):
        print("get")
        if not web_url: return False
        self.get("chrome://settings/content/siteDetails?site=" + web_url)
        root1 = self.driver.find_element(By.TAG_NAME, "settings-ui")
        shadow_root1 = self.expand_root_element(root1)
        root2 = shadow_root1.find_element(By.ID, "container")
        root3 = root2.find_element(By.ID, "main")
        shadow_root3 = self.expand_root_element(root3)
        shadow_root3 = self.expand_root_element(root3)
        root4 = shadow_root3.find_element(By.CLASS_NAME, "showing-subpage")
        shadow_root4 = self.expand_root_element(root4)
        root5 = shadow_root4.find_element(By.ID, "advancedPage")
        root6 = root5.find_element(By.TAG_NAME, "settings-privacy-page")
        shadow_root6 = self.expand_root_element(root6)
        root7 = shadow_root6.find_element(By.ID, "pages")
        root8 = root7.find_element(By.TAG_NAME, "settings-subpage")
        root9 = root8.find_element(By.TAG_NAME, "site-details")
        shadow_root9 = self.expand_root_element(root9)
        root10 = shadow_root9.find_element(By.ID, "plugins")
        shadow_root10 = self.expand_root_element(root10)
        root11 = shadow_root10.find_element(By.ID, "permission")
        Select(root11).select_by_value("allow")

    def expand_root_element(self, element):
        return self.driver.execute_script("return arguments[0].shadowRoot", element)


    def get_flash_url(self, web_url):
        if not web_url: return False
        self.add_flash_site(web_url)
        self.get(web_url)

    def quit_driver(self):
        self.driver.quit()


driver=chromeDriver()
driver.get_flash_url("www.baidu.com")

一层层找，真是头痛，可以用以下方法实现：

利用pyautogui启动页面后直接一波键盘操作，可行，可是不能后台。

self.browser.get("chrome://settings/content/siteDetails?site=http%3A%2F%2Fsjjy.gdsf.gov.cn")
        # time.sleep(3)
        # for i in range(16):
        #     pyautogui.press(['tab'])   # 按下 5 * 9 = 45 次正好到更改
        # pyautogui.press('enter')
        # time.sleep(1)
        # pyautogui.press(['down'])
        # time.sleep(1)
        # pyautogui.press('enter')
        # time.sleep(1)
#这里直接用selenium模拟键盘也行
        root1 = self.browser.find_element(By.TAG_NAME, "settings-ui")
        
        for i in range(16):
            root1.send_keys(Keys.TAB) 
        time.sleep(2)
        root1.send_keys(Keys.ENTER)
        root1.send_keys(Keys.DOWN)
        root1.send_keys(Keys.ENTER)

yjxtor

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
selenium来写自动化远程教育

selenium来写自动化远程教育一、利用webdriver来启动chrome,这里涉及webdriver的安装。1.安装的webdriver需要和chrome的版本对应，并且要设置环境变量。2.启动参数，chrome_options = Options()，有时候会崩溃，要使用–no-sandbox参数，options参数很多。可以百度一下学习。3.如果想获取chrome的network和console参数，还要设置self.browser = webdriver.Chrome(options=
复制链接

扫一扫