爬虫-第一节-selenium的简单使用

生物工具人

于 2021-10-10 14:31:27 发布

阅读量153

点赞数

分类专栏：爬虫文章标签： selenium 爬虫 python

本文链接：https://blog.csdn.net/qq_40182103/article/details/120685029

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

用selenium模拟人的浏览网页的行为

1 在windows10使用selenium爬取KEGG网页

最近学会一个非常好用的包，用来爬取网页，做一个记录

1 在windows10使用selenium爬取KEGG网页

需要的环境：

安装chrome和chromedriver（安装需要的浏览器，这里以Chrome为例；安装对应版本的chromedriver；加入环境变量；下面做详细说明）
安装selenium包（打开cmd；pip install selenium）

1.1 安装必要的包和软件

1.1.1 安装chromedriver

找到Chrome的版本号，在https://chromedriver.chromium.org/downloads下载对应的chromedriver。
在这里插入图片描述解压到Chrome的安装目录，见下图。

将以上两个软件加入环境变量。若加入成功，在cmd界面运行chrome
在这里插入图片描述

1.2 实例（爬取KEGG网页的KEGG Pathway）

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.kegg.jp/kegg/')##输入需要爬取的网页网址

在这里插入图片描述
按Ctrl+Shift+i打开开发者模式，按照下图顺序找到我们需要的KEGG PATHWAY的链接

在这里插入图片描述

link = driver.find_element_by_link_text('KEGG PATHWAY')##根据链接文本找到链接元素
link.click()##点击链接跳转到新的页面，见下图

在这里插入图片描述

html_source = driver.page_source##获取新网页的源代码
print(html_source)##见下图

在这里插入图片描述
参考：
https://www.geeksforgeeks.org/find_element_by_link_text-driver-method-selenium-python/
https://blog.csdn.net/xhaimail/article/details/105435794
https://chromedriver.chromium.org/downloads

生物工具人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫-第一节-selenium的简单使用

用selenium模拟人的浏览网页的行为1 在windows10使用selenium爬取KEGG网页1.1 安装必要的包和软件1.1.1 安装chromedriver1.2 实例（爬取KEGG网页的KEGG Pathway）最近学会一个非常好用的包，用来爬取网页，做一个记录1 在windows10使用selenium爬取KEGG网页需要的环境：安装chrome和chromedriver（安装需要的浏览器，这里以Chrome为例；安装对应版本的chromedriver；加入环境变量；下面做详细说明）
复制链接

扫一扫