python怎么接管浏览器_用python操作浏览器的三种方式

最新推荐文章于 2024-07-05 03:25:29 发布

谢婆婆

最新推荐文章于 2024-07-05 03:25:29 发布

阅读量1.8k

点赞数

文章标签： python怎么接管浏览器

本文链接：https://blog.csdn.net/weixin_33476081/article/details/111988722

版权

本文详细介绍了Python中三种操作浏览器的方式：selenium、webbrowser和Splinter。首先，讲解了selenium如何导入浏览器驱动，并通过get方法打开网页。接着，介绍了使用webbrowser标准库打开浏览器的示例。再者，阐述了Splinter模块的安装和使用，包括自动登录126邮箱的案例。此外，文章深入探讨了selenium的webdriver，包括页面元素定位的各种方法，如id、name、class、tag、link_text、partial_link_text、css selector和xpath等。

摘要由CSDN通过智能技术生成

第一种：selenium导入浏览器驱动，用get方法打开浏览器，例如：

import time

from selenium import webdriver

def mac():

driver = webdriver.Firefox()

driver.implicitly_wait(5)

driver.get('http://huazhu.gag.com/mis/main.do')

第二种：通过导入python的标准库webbrowser打开浏览器，例如：

>>> import webbrowser

>>> webbrowser.open('C:\\Program Files\\Internet Explorer\\iexplore.exe')

True

>>> webbrowser.open('C:\\Program Files\\Internet Explorer\\iexplore.exe')

True

第三种：使用Splinter模块模块

一、Splinter的安装

Splinter的使用必修依靠Cython、lxml、selenium这三个软件。所以，安装前请提前安装

Cython、lxml、selenium。以下给出链接地址：

1)http://download.csdn.net/detail/feisan/4301293

2)http://code.google.com/p/pythonxy/wiki/AdditionalPlugins#Installation_no

3)http://pypi.python.org/pypi/selenium/2.25.0#downloads

4)http://splinter.cobrateam.info/

二、Splinter的使用

这里，我给出自动登录126邮箱的案例。难点是要找到页面的账户、密码、登录的页面元素，这里需要查看126邮箱登录页面的源码，才能找到相关控件的id.

例如:输入密码，密码的文本控件id是pwdInput.可以使用browser.find_by_id()方法定位到密码的文本框，

接着使用fill()方法，填写密码。至于模拟点击按钮，也是要先找到按钮控件的id,然后使用click()方法。

#coding=utf-8

import time

from splinter import Browser

def splinter(url):

browser = Browser()

#login 126 email websize

browser.visit(url)

#wait web element loading

time.sleep(5)

#fill in account and password

browser.find_by_id('idInput').fill('xxxxxx')

browser.find_by_id('pwdInput').fill('xxxxx')

#click the button of login

browser.find_by_id('loginBtn').click()

time.sleep(8)

#close the window of brower

browser.quit()

if __name__ == '__main__':

websize3 ='http://www.126.com'

splinter(websize3)

WebDriver简介

selenium从2.0开始集成了webdriver的API，提供了更简单，更简洁的编程接口。selenium webdriver的目标是提供一个设计良好的面向对象的API，提供了更好的支持进行web-app测试。从这篇博客开始，将学习使用如何使用python调用webdriver框架对浏览器进行一系列的操作

打开浏览器

在selenium+python自动化测试(一)–环境搭建中，运行了一个测试脚本，脚本内容如下：

from selenium import webdriver

import time

driver = webdriver.Chrome()

driver.get('http://www.baidu.com')

print(driver.title)

driver.find_element_by_id('kw').send_keys('selenium')

driver.find_element_by_id('su').click()

time.sleep(3)

driver.close()

webdriver是一个Web应用程序测试自动化工具，用来验证程序是否如预期的那样执行。

webdriver.Chrome()：创建一个Chrome浏览器的webdriver实例

driver.get(“http://www.baidu.com“)：打开”http://www.baidu.com“页面

driver.find_element_by_id(“kw”).send_keys(“selenium”)

找到id为“kw”的元素，在这个页面上为百度首页的搜索框，在其中输入“selenium”

driver.find_element_by_id(“su”).click()：找到id为“su”的元素并点击，在这个页面上为百度首页的“百度一下”按钮

driver.close()：退出浏览器

运行脚本的第一步是打开浏览器，使用webdriver.Chrome()打开谷歌浏览器，如果要指定其他浏览器，比如要使用Firefox或者IE浏览器，更换浏览器名称就可以了

driver = webdriver.Chrome() //打开Chrome浏览器

driver = webdriver.Firefox() //打开Firefox浏览器

driver = webdriver.Ie() //打开IE浏览器

第二步操作是打开页面，使用driver.get(url)方法来打开网页链接，例如脚本中打开百度首页

driver.get('http://www.baidu.com')

接下来是print(driver.title)，使用driver.title获取当前页面的title，title就是在浏览器tab上显示的内容，例如百度首页的标题是“百度一下，你就知道”

浏览器前进后退

在当前页面打开一个新的链接后，如果想回退到前一个页面，使用如下driver.back()，相当于点击了浏览器的后退按钮

和back操作对应的是浏览器前进操作driver.forward()，相当于点击了浏览器的前进按钮

driver.back() //回到上一个页面

driver.forward() //切换到下一个页面

浏览器运行后，如果页面没有最大化，可以调用driver.maximize_window()将浏览器最大化，相当于点击了页面右上角的最大化按钮

driver.maximize_window() //浏览器窗口最大化

driver.set_window_size(800, 720) //设置窗口大小为800*720

浏览器截屏操作，参数是截屏的图片保存路径：

driver.get_screenshot_as_file('D:/data/test.png') 屏幕截图保存为***

driver.refresh() //重新加载页面,页面刷新

在测试脚本运行完后，一般会在最后关闭浏览器，有两种方法关闭浏览器，close()方法用于关闭当前页面，quit()方法关闭所有和当前测试有关的浏览器窗口

driver.close() //关闭当前页面

driver.quit() //关闭所有由当前测试脚本打开的页面

页面元素定位

要定位页面元素，需要找到页面的源码。

IE浏览器中，打开页面后，在页面上点击鼠标右键，会有“查看源代码”的选项，点击后就会进入页面源码页面，在这里就可以找到页面的所有元素

使用Chrome浏览器打开页面后，在浏览器的地址栏右侧有一个图标，点击这个图标后，会出现许多菜单项，选择更多工具里的开发者工具，就会出现页面的源码，不同版本的浏览器菜单选项可能不同，但是都会在开发者工具里找到页面的源码

Firefox浏览器打开页面后，在右键菜单里也可以找到“查看页面源代码”的选项。在Firefox中，可以使用浏览器自带的插件查看定位元素，在Firefox的附加组件里搜索firebug进行下载，安装firebug组件后会在浏览器的工具栏中多出一个小虫子的图标，点击这个图标就可以打开组件查看页面源码，打开后如下图所示

以百度首页搜索页面为例，看一下webdriver定位元素的八种方式

使用id定位

在页面源码中找到搜索输入框的元素定义

可以看到输入框有一个有一个id的属性，调用find_element_by_id()根据id属性来找到元素，参数为属性的值

input_search = driver.find_element_by_id('kw')

使用name定位

使用find_element_by_name()根据name属性找到元素，参数为name属性的值

搜索框有一个name=”wd”的属性，使用name查找搜索输入框元素

input_search = driver.find_element_by_name('wd')

使用className定位

使用find_element_by_class_name()根据className属性找到元素，参数为className属性的值

搜索框有一个class=”s_ipt”的属性，使用className查找元素