Python 爬虫中国知网论文过程中遇到的坑及解决办法

假期,老师给布置了 Python 爬虫中国知网论文的任务,目前实现了登录和搜索功能,先写一下遇到的坑和解决办法吧。

一. selenium 模块

概念:是一个基于浏览器自动化的模块。

其与爬虫间的关系:

  1. 便捷捕获到动态加载的数据(可见即可得);
  2. 实现模拟登录。

缺点:慢。(可以理解成 requests 模块可能 1 秒发起 10 个请求,但 selenium 可能 1 秒只发起 1 个请求)

环境安装:pip install selenium

基本使用:

  1. 使用某一款浏览器的驱动程序;
  2. 实例化某一款浏览器对象。

1. 浏览器驱动程序下载与安装

!坑:一直寻找和自己谷歌浏览器对应版本的驱动,没找到,结果换了一个稍低版本的驱动竟然也兼容。学我如果报错了,憋找我。。。

  • 1
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值