引言
在当今数字时代,音频转文本已成为许多企业和开发者的重要需求。Google云提供了强大的Speech-to-Text API,使得这个过程更加高效和准确。在本文中,我们将探讨如何使用Google Speech-to-Text API,将音频转录为文本,特别是通过GoogleSpeechToTextLoader这一工具。
主要内容
安装和设置
要开始使用Google Speech-to-Text API,首先必须安装 google-cloud-speech
Python 包。你可以访问Speech-to-Text客户端库页面以获取更多信息。完成安装后,按照Google Cloud快速入门指南创建项目并启用API。
%pip install --upgrade --quiet langchain-google-community[speech]
使用GoogleSpeechToTextLoader
GoogleSpeechToTextLoader需要两个参数:project_id
和file_path
。音频文件可以是Google Cloud存储的URI(gs://…)或者本地文件路径。
注意:仅支持同步请求,每个音频文件限制为60秒或10MB。
from langchain_google_community import GoogleS