用代理服务轻松访问ArXiv：如何使用ArxivAPIWrapper与AgentExecutor

本文链接：https://blog.csdn.net/akhfuiigabv/article/details/144339345

引言

在科学研究中，快速获取论文摘要与详细信息是至关重要的。ArXiv是一个知名的电子预印本网站，提供了大量的科学文献供研究者们查阅。然而，由于某些地区的网络限制，直接访问ArXiv的服务可能会受到影响。在这篇文章中，我们将介绍如何使用Python库ArxivAPIWrapper和AgentExecutor，并结合API代理服务，来无缝地访问ArXiv上的信息。

主要内容

ArxivAPIWrapper简介

ArxivAPIWrapper是一个Python库，它提供了一种高效的方法来查询ArXiv上的文献信息。它可以返回以下字段：发布日期、标题、作者和摘要。查询文本限制为300个字符。

安装

首先，确保你已经安装了langchain-community和arxiv包：

%pip install --upgrade --quiet langchain-community arxiv

AgentExecutor简介

AgentExecutor结合多种工具和大型语言模型（LLM），可以自动执行复杂的查询请求。在这里，我们将它与ArxivAPIWrapper结合，进一步增强查询能力。

配置与使用

配置LLM和工具：

from langchain import hub
from langchain.agents import AgentExecutor, create_react_agent, load_tools
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(temperature=0.0)
tools = load_tools(["arxiv"])
prompt = hub.pull("hwchase17/react")

agent = create_react_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

使用AgentExecutor查询ArXiv：

response = agent_executor.invoke({"input": "What's the paper 1605.08386 about?"})
print(response)

注意：以上代码中使用了{AI_URL}作为API端点的示例，开发者可以使用API代理服务提高访问稳定性。

代码示例

以下是如何使用ArxivAPIWrapper查询特定作者的文章的完整示例：

from langchain_community.utilities import ArxivAPIWrapper

# 初始化API Wrapper
arxiv = ArxivAPIWrapper()

# 查询作者的文章信息
docs = arxiv.run("Caprice Stanley")
print(docs)