# 引言
在数字时代,音频转录正变得越来越重要,无论是会议记录、语音备忘录还是客户服务对话。Google Cloud Speech-to-Text API 提供了一种强大且灵活的方式来将音频文件转录为文本。本篇文章将指导你如何使用Google Speech-to-Text功能,将音频文件转换为文本,并详细演示其使用方法和注意事项。
# 主要内容
## 安装与设置
首先,你需要确保安装`google-cloud-speech` Python 包。此外,创建一个 Google Cloud 项目并启用 Speech-to-Text API 是必要的步骤。可以在 [Speech-to-Text 客户端库页面](https://cloud.google.com/speech-to-text/docs/reference/libraries) 找到更多信息。
使用以下命令安装所需包:
```bash
%pip install --upgrade --quiet langchain-google-community[speech]
详细的项目创建和API启用步骤,请参阅 Google Cloud 文档中的 入门指南.
示例使用
GoogleSpeechToTextLoader
是一个重要的类,它需要 project_id
和 file_path
作为参数。你可以使用 Google Cloud Storage URI (如 gs://...
) 或本地文件路径 (如 ./audio.wav
)。
from langchain_google_community import GoogleSpeechToTextLoader
project_id = "<PROJECT_ID>"
file_path