探索ArXiv API的潜力：轻松获取学术论文信息_arxiv的api提供学者信息吗-CSDN博客

本文链接：https://blog.csdn.net/afTFODguAKBF/article/details/143871164

# 探索ArXiv API的潜力：轻松获取学术论文信息

## 引言

在信息爆炸的时代，获取最新的科研进展变得尤为重要，尤其是在快速发展的AI和编程领域。ArXiv是一个广受学术界欢迎的开放存取预印本服务器，它包含了众多领域的前沿研究论文。本篇文章将介绍如何使用 `langchain` 框架和 `ArxivAPIWrapper` 来简化从ArXiv获取论文信息的流程。

## 主要内容

### 使用ArxivAPIWrapper

`ArxivAPIWrapper` 是一个强大的工具，帮助用户通过简单的查询获取 ArXiv 的学术文章信息。其返回的结果包括发布日期、论文标题、作者列表及论文摘要，非常适合快速了解某一领域的研究动态。

### 设置和安装

要开始使用 `thearxiv` 工具，请执行以下命令安装所需的Python包：

```bash
%pip install --upgrade --quiet langchain-community arxiv

使用 AgentExecutor 查找论文信息

通过结合 langchain 的 AgentExecutor，可以构建一个智能代理来自动化检索流程。以下是一个示例代码片段：

from langchain import hub
from langchain.agents import AgentExecutor, create_react_agent, load_tools
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(temperature=0.0)
tools = load_tools(["arxiv"])
prompt = hub.pull("hwchase17/react")

agent = create_react_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 使用API代理服务提高访问稳定性
agent_executor.invoke({
    "input": "What's the paper 1605.08386 about?",
})

以上代码通过调用 ArXiv API 来获取论文ID为 “1605.08386” 的详细信息。

代码示例

下面是如何使用 ArxivAPIWrapper 直接获取论文信息的示例：

from langchain_community.utilities import ArxivAPIWrapper

arxiv = ArxivAPIWrapper()
# 使用API代理服务提高访问稳定性
docs = arxiv.run("1605.08386")
print(docs)

# 输出:
# Published: 2016-05-26
# Title: Heat-bath random walks with Markov bases
# Authors: Caprice Stanley, Tobias Windisch
# Summary: Graphs on lattice points are studied whose edges come from a finite...