selenium
selenium相关问题
python__reported
python菜鸟入门,期待成为数据分析的大神;
互相帮助!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
中国裁判文书下载:selenium路线
中国裁判文书下载:selenium路线一、requests路线二、selenium路线问题一:namespace error 命名空间错误问题二:元素的动态变化问题三、只显示前600份裁判文书问题四:弹出框的处理三、selenium路线的缺陷 成功现状: 一、requests路线 requests路线需要对js进行解密,对js解密时遇到三个参数 docid cipher __RequestVerificationToken 这三个参数主要是针对文书列表页面的 试图在这个页面获取相应的链接, js解密后原创 2020-06-05 18:24:18 · 4609 阅读 · 7 评论 -
selenium的namespace错误与无法定位:NamespaceError: An attempt was made to create...andUnable to locate elemen
selenium报错:NamespaceError: An attempt was made to create or change an object in a way which is incorrect with regard to namespaces'一、报错二、原因 一、报错 'selenium.common.exceptions.InvalidSelectorException: Message: Given xpath expression' "/html/body/div/div[4]/原创 2020-05-28 13:51:30 · 4519 阅读 · 0 评论 -
重装系统后:selenium无法找到chrome--报错selenium.common.exceptions.WebDriverException: Message: unknown error: c
重装系统后:selenium无法找到chrome--selenium.common.exceptions.WebDriverException: Message: unknown error: cannot find Chrome binary一、报错二、解决方法三、第二个报错:四、解决方法: 一、报错 selenium.common.exceptions.WebDriverException: Message: unknown error: cannot find Chrome binary 翻译过来原创 2020-05-21 20:54:52 · 4463 阅读 · 0 评论 -
selenium节点(元素)遍历的疑惑
selenium节点的遍历一、节点遍历是什么二、问题三、解决方法四、结语 一、节点遍历是什么 例如: 由于裁判文书网只显示前600个,我的思路就是通过关键词的限定实现内容在600条以内,因而完整的下载需要进行关键词的遍历 html: 二、问题 直接进行遍历会报错,原因不明 如: from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support import原创 2020-06-09 11:59:10 · 4666 阅读 · 4 评论 -
selenium弹窗之windows下载文件弹窗点击方法
selenium弹窗之下载文件弹窗点击一、弹窗类型二、windows下载文件弹窗点击方法pyuserinput模块pyautogui模块 一、弹窗类型 一般说到selenium中的弹窗包括以下三种类型: 类型一:窗口柄 这种窗口常说的就是窗口句柄,其实并不能算弹窗,应该属于窗口切换 类型二:web弹窗 使用如下命令导致的: browser = webdriver.Firefox() browser.implicitly_wait(0.1) browser.get('https://www.bilibil原创 2020-05-28 15:26:23 · 7683 阅读 · 2 评论 -
爬虫修正:裁判文书网20200901更新增加登录系统
爬虫修正:裁判文书网20200901更新增加登录系统一、登录系统的增加二、增加登录函数三、一个比较纠结的地方 一、登录系统的增加 导致需要登录,直接是无法进入了。以往可以直接进入具体的类别如 现在无法进入,点击该网址,后跳转到登录界面 需要通过手机号进行注册后才可以进入 二、增加登录函数 def login(self): """登录""" # 切换框架 wait = self.wait self.browser.refresh() frame原创 2020-09-04 15:31:35 · 5016 阅读 · 42 评论 -
裁判文书爬虫可执行版本
裁判文书爬虫可执行版本一、裁判文书爬虫二、使用方法(一)文字说明(二)图片说明三、下载方式四、结语 一、裁判文书爬虫 二、使用方法 (一)文字说明 README.md Referee-document-crawler.exe 文件位置:可执行的.exe文件位于Scripts/dist中,名字为定制selenium爬虫.exe 使用方法:需要将dist这个文件夹下载下来,因为其中的png文件不能缺少,这是一个图片,缺少就会报错 具体的.exe的使用方法:界面中有四个输入框,名字已经进行了说明; 需要注意的原创 2020-07-09 11:42:29 · 4473 阅读 · 5 评论 -
Selenium+Firefox的自动下载(去掉下载弹窗)
Selenium+Firefox的自动下载(去掉下载弹窗)一、去掉下载弹窗的优点二、去掉下载弹窗的一般命令三、重点 一、去掉下载弹窗的优点 检索键盘鼠标自动化控制模块的导入 可以无头化运行,不影响同时进行的其他的任务 二、去掉下载弹窗的一般命令 from selenium.webdriver import FirefoxProfile #导入相应的设置模块 profile = webdriver.FirefoxProfile() #实例化 profile.set_preference('browser.do原创 2020-07-07 22:34:38 · 4470 阅读 · 2 评论 -
selenium的两种sendkeys差异
selenium的两种sendkeys差异一、两种需要输入的文本框(一)第一种:常态的文本输入框(二)第二种:特殊的文本输入框二、问题三、解决方法 预览: 报错: 'FirefoxWebElement' object has no attribute 'sendkeys' 方法: actions.move_to_element(time_send).send_keys("2019-01-01").perform()#开始日期 成功截图: 一、两种需要输入的文本框 此处均以裁判文书网为例 (一)第一种:原创 2020-06-29 13:31:14 · 10569 阅读 · 0 评论
分享