使用scihub2pdf，在scihub通过doi批量下载文献pdf格式

最新推荐文章于 2022-08-25 10:37:39 发布

Leilani~

最新推荐文章于 2022-08-25 10:37:39 发布

阅读量1.9k

点赞数 2

分类专栏： python 爬虫批量下载文献文章标签：爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42338804/article/details/115601773

版权

python 同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

批量下载文献

1 篇文章 0 订阅

订阅专栏

最近要批量下载某个方向的一些文献，准备通过sci-hub来下载，在找python爬虫的方式下载文献的时候发现了scihub2pdf工具。

一开始是看到这篇文章：利用python下载scihub成文献为PDF，在里面看到了一个批量下载scihub文献的的工具：scihub2pdf

我是在ubuntu系统里操作的安装的方式和官网里的差不多：

Install

$  pip3 install scihub2pdf

Linux Using npm

$ sudo apt-get install npm
$ sudo npm install -g phantomjs

安装后还有一件事：修改源码，源码里的地址为http://sci-hub.cc开头的，我要使用的网站是https://scihubtw.tw/，这个👇
在这里插入图片描述
修改源码： download.py里的42行，我的改为如下
我的download.py文件在/usr/local/lib/python3.6/ddist-packges/scihub2pdf 里

具体使用方法：

通过DOI值

$ scihub2pdf 10.1038/s41524-017-0032-0

我的使用👇
在这里插入图片描述
批量使用DOI

txt文件里内容：

10.1038/s41524-017-0032-0
10.1063/1.3149495
.....

$ scihub2pdf -i dois.txt --txt

我的使用👇
在这里插入图片描述
小tips:
1、下载时，我是在root用户下使用的。
2、下载文件的路径，即你的root打开目录。
3、下载下来有一个png图片，我不想要图片，可以在scihub.py的162行注销，就不会有了

4、将doi放在txt文件里批量下载的时候，让txt文件在你打开的文件里面就可以了。我是放在这个文件里面的在这里插入图片描述
5、在普通用户下，出现ghostdriver.log文件权限问题时，修改权限即可在普通用户下使用。

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
使用scihub2pdf，在scihub通过doi批量下载文献pdf格式

最近要批量下载某个方向的一些文献，准备通过sci-hub来下载，在找python爬虫的方式下载文献的时候发现了scihub2pdf工具。一开始是看到这篇文章：利用python下载scihub成文献为PDF，在里面看到了一个批量下载scihub文献的的工具：scihub2pdf我是在ubuntu系统里操作的安装的方式和官网里的一样：Install$ sudo python /usr/bin/pip install scihub2pdfLinux Using npm$ sudo apt-get i
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。