阅读文章时每当看到一篇优秀的参考文献总会把持不住自己去往文章后面翻,然后找到它的名字,再去找数据库搜索并下载,如此一番,至少3分钟过去了......再回过头来继续读原来的文章,卧槽,读到哪了?!于是,慌张的小手拿起了手机,打开了抖音,嗯这是啥?我竟然没吃过!
今天课题组一位同学问我能不能直接找到这篇文章中的参考文章并下载下来,我尝试了一下,3分钟教你秒杀所有。
我以Nature Communications的一篇文章为例,Responses of plant diversity to precipitation change are strongest at local spatial scales and in drylands。本文仅供参考,出了任何问题概不负责。
希望大家仅作为学术使用,不要过度爬取,遵守网络秩序。
import requests
from lxml import etree
url = "文章的url"
resp = requests.get(url)
tree = etree.HTML(resp.text)
divs = tree.xpath('//*[@id="Bib1-content"]/div/ol/li')
for div in divs:
ref = div.xpath("./p[2]/a[1]/@href")
print(ref)
#上面这些可以得到文章的网站链接(图一),可以直