selenium模块的基本使用
驱动程序和浏览器的映射关系(浏览器驱动下载路径也包含在内):https://blog.csdn.net/m0_46299185/article/details/119725783?spm=1001.2014.3001.5502
若想要试试手,可以参考这篇文章了解基本使用:https://blog.csdn.net/m0_46299185/article/details/119985475?spm=1001.2014.3001.5502
问题:selenium模块和爬虫之间具有着怎样的关联?
- 便捷的获取网站中动态加载的数据
- 便捷实现模拟登录
什么是selenium模块?
- 基于浏览器自动化的一个模块
selenium使用流程:
- 环境安装:pip install selenium
- 下载一个浏览器的驱动程序(这里谷歌浏览器为例)
- 下载路径:http://chromedriver.storage.googleapis.com/index.html
- 驱动程序和浏览器的映射关系:https://blog.csdn.net/m0_46299185/article/details/119725783?spm=1001.2014.3001.5502
- 实例化一个浏览器对象
- 编写基于浏览器自动化的操作代码
- 发起请求:get(url)
- 标签定位:find系列的方法
- 标签交互:send_keys('xxx')
- 执行js程序:excute_script('jsCode')
- 前进,后退:back(),forward()
- 关闭浏览器:quit()
- selenium处理iframe
- 如果定位的标签存在于iframe标签之中,则必须收用switch_to.frame(id)
- 动作链(拖动):from selenium.webdriver import ActionChains
- 实例化一个动作链对象:action=ActionChains(bro)
- click_and_hold(div) : 点击且长按操作
- move_by_offset(x,y)
- perform()让动作链立即执行
- action.release()释放动作链对象