Selenium库

selenium库是一个自动化测试工具,能够驱动浏览器模拟人的操作,如鼠标单击、键盘输入等。
通过selenium库能够比较容易地获取到网页的源代码,还可以进行网络内容的批量自动下载等。
上海证券交易所的公开信息、新浪财经的股票行情实时数据等网页都是动态渲染出来的,而通过
常规爬虫手段获取的则是未经渲染的信息,面对这种没有渲染的网页,在数据挖掘时就需要使用
selenium库,通过模拟人在浏览器中的操作,快速获取渲染后的网页源代码。

一、模拟浏览器chromeDriver的下载与安装

1.安装谷歌浏览器并查看版本号

安装chromedriver之前,得先安装谷歌浏览器,然后查看所安装的谷歌浏览器的版本。
单击浏览器右上角三点,然后点击帮助,点击关于google chrome命令,在关于Chrome对话框
就能看到当前安装的谷歌浏览器的版本号。
在这里插入图片描述
在这里插入图片描述

2.chromedriver下载

chromedriver版本需要与Chrome版本一致,笔者chrome版本为103.0.0506,只需要找到
chromedriver一样的版本就好。具体操作如下:
chromedriver官方下载地址:https://npm.taobao.org/mirrors/chromedriver/
or
http://chromedriver.storage.googleapis.com/index.html
在这里插入图片描述
显示如下图即是安装完成!
在这里插入图片描述

二、selenium库的安装

pip install selenium

显示如下图即是安装完成!
在这里插入图片描述

1. 先了解Selenium的基本知识 Selenium是一个用于Web应用程序测试的工具,它可以模拟用户在Web页面上的各种操作,如点击、填写表单、上传文件等。在学习Selenium之前,建议先了解基本的Web开发知识,包括HTML、CSS、JavaScript等等。 2. 安装并配置好Selenium 在Python中使用Selenium,首先需要安装Selenium和一个浏览器的WebDriver驱动程序。这个驱动程序的作用是在代码中操作浏览器,模拟各种行为。要了解如何安装和配置,请查看Selenium的官方文档。 3. 学习Selenium的API文档 Selenium提供了各种API方法,用于模拟各种用户行为。在学习Selenium时,首先要学习Selenium的API文档,了解每个方法的用法、参数和返回值。熟悉这些API可以帮助你编写更加有效的代码。 4. 编写测试脚本并练习 学习Selenium最好的方法是编写测试脚本并练习。可以制定一些测试用例,然后用Selenium编写自动化测试脚本。在编写代码时,要注重代码的可读性和可维护性,尽量写出简洁清晰的代码。 5. 参考文档和社区 Selenium有很多优秀的学习资源和社区,可以在这些资源中学到更多的知识和技巧。建议多查看Selenium官方文档、Selenium Webdriver Guide、stackoverflow等社区,了解Selenium的一些最佳实践。通过这些资源,可以更快地了解Selenium,并且在使用Selenium时遇到问题时可以得到帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值