selenium + ChromeDriver 实战系列之启信宝（一）

最新推荐文章于 2024-01-25 16:43:37 发布

月_神

最新推荐文章于 2024-01-25 16:43:37 发布

阅读量324

点赞数

分类专栏：爬虫相关文章标签：定位 java python selenium 算法

本文链接：https://blog.csdn.net/hqq1256881740/article/details/111504227

版权

之前写了一篇selenium + ChromeDriver的一些入门的知识，这篇博客里面找了启信宝这个网站，简单的进行了一个实战练习。本篇博客的结构如下：

首先会给出一些使用 selenium + ChromeDriver的入门的一些友情链接

其次讲解一下本人在爬取网站的一些思路和流程

最后给出github地址并总结经验。

1. 友情链接

环境配置以及入门知识参考我的之前一篇博客：

http://www.cnblogs.com/caizheng/p/7344561.html

详细使用方式参考webDriver中文社区：

http://www.webdriver.org/nav1/

使用过程的常见异常参考他人博客：

https://blog.csdn.net/fengqingting2/article/details/18302365

2. 爬取思路及流程

整体的爬取思路见上图，分为两个流程的原因是：在点击页面去向另一个页面时会出现让你登陆或者数据验证码的情况。如果每一步都要进行判断不好管理，还不如直接放在一个方法里面进行管理。只要每次有点击页面链接或者按钮的情况都进入到页面判断及处理流程中去。通过这个方法判断你新进入的页面是什么情况，并且对不同的页面进行不同的处理。下面对每个步骤进行详细讲解

2.1 点击登录

 1 //去登陆页面并且登录
 2 public static void toLoginAndLogin(WebDriver driver) {
 3     //1、去登陆页面
 4     List<WebElement> elements = driver.findElements(By.cssSelector("div.pull-right a"));
 5     //2、通过下标得到对应的登录链接
 6     WebElement lo

最低0.47元/天解锁文章

月_神

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
selenium + ChromeDriver 实战系列之启信宝（一）

之前写了一篇selenium + ChromeDriver的一些入门的知识，这篇博客里面找了启信宝这个网站，简单的进行了一个实战练习。本篇博客的结构如下：首先会给出一些使用selenium + ChromeDriver的入门的一些友情链接其次讲解一下本人在爬取网站的一些思路和流程最后给出github地址并总结经验。1. 友情链接环境配置以...
复制链接

扫一扫