![](https://img-blog.csdnimg.cn/20210703105717393.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
selenium
selenium相关问题
python__reported
python菜鸟入门,期待成为数据分析的大神;
互相帮助!
展开
-
中国裁判文书下载:selenium路线
中国裁判文书下载:selenium路线一、requests路线二、selenium路线问题一:namespace error 命名空间错误问题二:元素的动态变化问题三、只显示前600份裁判文书问题四:弹出框的处理三、selenium路线的缺陷成功现状:一、requests路线requests路线需要对js进行解密,对js解密时遇到三个参数docidcipher__RequestVerificationToken这三个参数主要是针对文书列表页面的试图在这个页面获取相应的链接,js解密后原创 2020-06-05 18:24:18 · 4100 阅读 · 7 评论 -
selenium的namespace错误与无法定位:NamespaceError: An attempt was made to create...andUnable to locate elemen
selenium报错:NamespaceError: An attempt was made to create or change an object in a way which is incorrect with regard to namespaces'一、报错二、原因一、报错'selenium.common.exceptions.InvalidSelectorException: Message: Given xpath expression' "/html/body/div/div[4]/原创 2020-05-28 13:51:30 · 4256 阅读 · 0 评论 -
重装系统后:selenium无法找到chrome--报错selenium.common.exceptions.WebDriverException: Message: unknown error: c
重装系统后:selenium无法找到chrome--selenium.common.exceptions.WebDriverException: Message: unknown error: cannot find Chrome binary一、报错二、解决方法三、第二个报错:四、解决方法:一、报错selenium.common.exceptions.WebDriverException: Message: unknown error: cannot find Chrome binary翻译过来原创 2020-05-21 20:54:52 · 4270 阅读 · 0 评论 -
selenium节点(元素)遍历的疑惑
selenium节点的遍历一、节点遍历是什么二、问题三、解决方法四、结语一、节点遍历是什么例如:由于裁判文书网只显示前600个,我的思路就是通过关键词的限定实现内容在600条以内,因而完整的下载需要进行关键词的遍历html:二、问题直接进行遍历会报错,原因不明如:from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import原创 2020-06-09 11:59:10 · 4490 阅读 · 4 评论 -
selenium弹窗之windows下载文件弹窗点击方法
selenium弹窗之下载文件弹窗点击一、弹窗类型二、windows下载文件弹窗点击方法pyuserinput模块pyautogui模块一、弹窗类型一般说到selenium中的弹窗包括以下三种类型:类型一:窗口柄这种窗口常说的就是窗口句柄,其实并不能算弹窗,应该属于窗口切换类型二:web弹窗使用如下命令导致的:browser = webdriver.Firefox()browser.implicitly_wait(0.1)browser.get('https://www.bilibil原创 2020-05-28 15:26:23 · 7237 阅读 · 2 评论 -
爬虫修正:裁判文书网20200901更新增加登录系统
爬虫修正:裁判文书网20200901更新增加登录系统一、登录系统的增加二、增加登录函数三、一个比较纠结的地方一、登录系统的增加导致需要登录,直接是无法进入了。以往可以直接进入具体的类别如现在无法进入,点击该网址,后跳转到登录界面需要通过手机号进行注册后才可以进入二、增加登录函数 def login(self): """登录""" # 切换框架 wait = self.wait self.browser.refresh() frame原创 2020-09-04 15:31:35 · 4623 阅读 · 42 评论 -
裁判文书爬虫可执行版本
裁判文书爬虫可执行版本一、裁判文书爬虫二、使用方法(一)文字说明(二)图片说明三、下载方式四、结语一、裁判文书爬虫二、使用方法(一)文字说明README.mdReferee-document-crawler.exe文件位置:可执行的.exe文件位于Scripts/dist中,名字为定制selenium爬虫.exe使用方法:需要将dist这个文件夹下载下来,因为其中的png文件不能缺少,这是一个图片,缺少就会报错具体的.exe的使用方法:界面中有四个输入框,名字已经进行了说明; 需要注意的原创 2020-07-09 11:42:29 · 4291 阅读 · 5 评论 -
Selenium+Firefox的自动下载(去掉下载弹窗)
Selenium+Firefox的自动下载(去掉下载弹窗)一、去掉下载弹窗的优点二、去掉下载弹窗的一般命令三、重点一、去掉下载弹窗的优点检索键盘鼠标自动化控制模块的导入可以无头化运行,不影响同时进行的其他的任务二、去掉下载弹窗的一般命令from selenium.webdriver import FirefoxProfile#导入相应的设置模块profile = webdriver.FirefoxProfile()#实例化profile.set_preference('browser.do原创 2020-07-07 22:34:38 · 4191 阅读 · 2 评论 -
selenium的两种sendkeys差异
selenium的两种sendkeys差异一、两种需要输入的文本框(一)第一种:常态的文本输入框(二)第二种:特殊的文本输入框二、问题三、解决方法预览:报错:'FirefoxWebElement' object has no attribute 'sendkeys'方法:actions.move_to_element(time_send).send_keys("2019-01-01").perform()#开始日期成功截图:一、两种需要输入的文本框此处均以裁判文书网为例(一)第一种:原创 2020-06-29 13:31:14 · 9890 阅读 · 0 评论