使用scihub2pdf,在scihub通过doi批量下载文献pdf格式

最近要批量下载某个方向的一些文献,准备通过sci-hub来下载,在找python爬虫的方式下载文献的时候发现了scihub2pdf工具。

一开始是看到这篇文章:利用python下载scihub成文献为PDF,在里面看到了一个批量下载scihub文献的的工具:scihub2pdf

我是在ubuntu系统里操作的安装的方式和官网里的差不多:

Install

$  pip3 install scihub2pdf

Linux Using npm

$ sudo apt-get install npm
$ sudo npm install -g phantomjs

安装后还有一件事:修改源码,源码里的地址为http://sci-hub.cc开头的,我要使用的网站是https://scihubtw.tw/,这个👇
在这里插入图片描述
修改源码: download.py里的42行,我的改为如下在这里插入图片描述
我的download.py文件在/usr/local/lib/python3.6/ddist-packges/scihub2pdf 里
在这里插入图片描述

具体使用方法:

通过DOI值

$ scihub2pdf 10.1038/s41524-017-0032-0

我的使用👇
在这里插入图片描述
批量使用DOI

txt文件里内容:

10.1038/s41524-017-0032-0
10.1063/1.3149495
.....
$ scihub2pdf -i dois.txt --txt

我的使用👇
在这里插入图片描述
小tips:
1、下载时,我是在root用户下使用的。
2、下载文件的路径,即你的root打开目录。
3、下载下来有一个png图片,我不想要图片,可以在scihub.py的162行注销,就不会有了
在这里插入图片描述
4、将doi放在txt文件里批量下载的时候,让txt文件在你打开的文件里面就可以了。我是放在这个文件里面的在这里插入图片描述
5、在普通用户下,出现ghostdriver.log文件权限问题时,修改权限即可在普通用户下使用。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值