快速下载 arXiv论文(arXiv PDF论文下载缓慢及中国镜像更新不及时解决方法)

- 背景

arXiv (https://arxiv.org/)是一个收集计算机科学、物理学、数学和生物学等多个学科的论文预印本网站,主站点在康奈尔大学,在全球多个地方设置有镜像网站。

国内由于某些限制导致直接访问速度很慢,一个 PDF 可能加载很久还是下不下来,参考资料 1详细地给出了用chrome 插件 tampermonkey(油猴插件)对网页中的arxiv 链接进行重定向到镜像网站的方法,其中油猴脚本可参考知乎上的回答2

- 问题

  1. arXiv的中国镜像 http://cn.arxiv.org/ 经常无法访问,中科院理论物理所也有一个备选网址: http://xxx.itp.ac.cn/ ,但是也不是特别稳定。
  2. 而且这两个 arxiv 在中国区的镜像更新有延迟,对于最近提交的文章,可能更新不及时无法收录。

- 解决方法

通过比较 arXiv 的各国镜像发现,印度镜像 (http://in.arxiv.org/) 更加稳定,下载速度虽然慢于国内镜像但是明显快于官方站点,而且其更新比国内镜像更为及时,因此可以作为国内镜像无法访问或者更新不及时情况下的一个补充。

对参考资料2中的JavaScript脚本的镜像做修改即可:

// ==UserScript==
// @name        redirect_arxiv
// @namespace   redirect_arxiv
// @include     *
// @include     https://*github.io*
// @include     https://*arxiv.org/*
// @include     https://*google.c*
// @include     https://*semanticscholar.org/*
// @include     https://*github.com*
// @include     https://*zhihu.com*
// @include     https://*brainpp.cn*
// @include     https://*outlook.cn*
// @version     1.0
// @grant       none
// ==/UserScript==

// 重定向 arxiv.org 到 xxx.itp.ac.cn(中科院理论物理研究所镜像)
// 重定向 arxiv.org 到 cn.arxiv.org(中国镜像,404)
// 重定向 arxiv.org 到 in.arxiv.org(印度镜像)

function findFatherNode(node, nodeName='A', maxDeep=1000){
    for (var i = 0; i < maxDeep; i++) {
        if (! node){return node}
        if (node.nodeName == nodeName){
            return node
        }else{
            node = node.parentElement
        }
    };
}

document.body.addEventListener('mousedown', function(e){
    var targ = e.target || e.srcElement;
    var aTag = findFatherNode(targ, 'A', 10);
    if (!aTag || !(aTag.href)){return};

    var headN = 17;
    var hrefHead = aTag.href.slice(0, headN);
    var hrefTail = aTag.href.slice(headN);
    if ( (hrefHead.indexOf('arxiv.org')==-1)){return};

    if ( hrefHead.match(/https?:\/\/arxiv\.org/) ) {
        hrefHead = hrefHead.replace(/https?:\/\/arxiv\.org/, 'http://xxx.itp.ac.cn');
        // hrefHead = hrefHead.replace(/https?:\/\/arxiv\.org/, 'http://cn.arxiv.org');
        // hrefHead = hrefHead.replace(/https?:\/\/arxiv\.org/, 'http://in.arxiv.org');
    }
    aTag.href = hrefHead + hrefTail
    // console.log(targ, targ.href);
});

在此感谢参考资料1 2作者!


  1. https://www.jianshu.com/p/184799230f20 ↩︎ ↩︎

  2. 国内为什么arxiv下载某个PDF特别卡? - 小磊的回答 - 知乎 ↩︎ ↩︎ ↩︎

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值