python批量检索文献_Python爬取知网信息——Python+selenium爬取知网信息(文献名,作者,来源,发表日期,文献类型)...

使用Python的selenium库爬取知网文献信息,包括文献名、作者、来源、发表日期和文献类型。用户输入关键词和页数,程序将结果保存到CSV文件。
摘要由CSDN通过智能技术生成

# -*- coding: utf-8 -*-

#时间:2019.5.1

#运行环境Python 3.*

'''

1、运行此代码前需要先下载Chrome浏览器,去百度搜索下载

2、我是利用selenium自动化测试工具进行爬取的,所以要再安装Selenium库,pip install selenium

3、ChromeDriver环境配置,先知道安装的Chrome浏览器的版本号,然后去https://chromedriver.storage.googleapis.com/index.html下载对应版本的驱动器,我用的是73的

所以下载驱动也是73版本的,接着要么是将这个可视化驱动Chromedriver.exe配置到环境变量中(这种方法我就不多说了,可以上网搜。我这提供我用的驱动:

链接:https://pan.baidu.com/s/1W5XWG3Rj8kNYHo9R9dmW_g

提取码:tqxd

复制这段内容后打开百度网盘手机App,操作更方便哦),我这儿是直接将路径作为参数传入,如下。

###运行的时候后会有Chrome浏览器弹出来,这时候在代码下方输入要爬取的页数,然后回车等结果就OK啦

'''

from selenium import webdriver

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.common.by import By

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值