arXiv API的Python封装教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00768/article/details/141043401

arXiv API的Python封装教程

项目地址:https://gitcode.com/gh_mirrors/ar/arxiv.py

项目介绍

arxiv.py 是一个用于访问arXiv API的Python封装库。arXiv是一个由康奈尔大学图书馆维护的项目，提供对物理学、数学、计算机科学、定量生物学、定量金融和统计学等领域超过一百万篇文章的开放访问。这个库使得开发者能够轻松地通过Python脚本与arXiv API进行交互，获取和处理学术文章数据。

项目快速启动

安装

首先，你需要安装arxiv.py库。你可以通过pip来安装：

pip install arxiv

基本使用

在你的Python脚本中，引入arxiv库并使用它来获取结果：

import arxiv

# 构建查询
search = arxiv.Search(
  query = "quantum computing",
  max_results = 10,
  sort_by = arxiv.SortCriterion.SubmittedDate
)

# 获取结果
for result in search.results():
  print(result.title)

应用案例和最佳实践

案例1：获取最新论文

你可以使用arxiv.py来定期检查某个领域的最新论文：

import arxiv
import datetime

# 获取过去一周的量子计算论文
search = arxiv.Search(
  query = "quantum computing AND submittedDate:[{0} TO {1}]".format(
    (datetime.datetime.now() - datetime.timedelta(days=7)).strftime('%Y%m%d'),
    datetime.datetime.now().strftime('%Y%m%d')
  ),
  max_results = 20,
  sort_by = arxiv.SortCriterion.SubmittedDate
)

for result in search.results():
  print(result.title, result.published)

案例2：下载论文

你可以下载感兴趣的论文PDF：

import arxiv

search = arxiv.Search(
  query = "machine learning",
  max_results = 1,
  sort_by = arxiv.SortCriterion.SubmittedDate
)

paper = next(search.results())
paper.download_pdf(filename="machine_learning_paper.pdf")