python知网下载_GitHub - ppho99/CNKI-download: 知网(CNKI)文献下载及文献速览爬虫

CNKI_download 中国知网爬虫

项目是基于Python3 实现的爬取知网数据的爬虫,可根据知网高级检索进行搜索,提供文献基本信息、文献下载、文献摘要等详细信息爬取功能。

实现过程可以查看我的博客

程序运行如下:

7c2e1b2089c8e0e249d22c084c2c1819.png

详细信息excel表格如下:

ee8f86a729f053639ee90b1d7a7c752c.png

下载caj如下:

6317e1b9557b2ea2523466cd0276686d.png

特点

通过发送解析包形式抓取数据,相比于使用selenium等方式性能稍高一些。

可使用知网高级检索功能进行搜索,更高效检索文献。

可根据网络及知网反爬虫情况选择性开启详细信息抓取及下载caj文献功能。

利用excel表格快速查看所需文献摘要等信息,可根据excel提供下载链接选择性下载,防止下载过快导致知网反爬。

使用方法

安装依赖

在验证码处理部

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值