谷歌宣布开源 Live Transcribe 语音识别转文字工具

最新推荐文章于 2024-08-07 09:58:39 发布

编程大乐趣

最新推荐文章于 2024-08-07 09:58:39 发布

阅读量322

点赞数

昨日，谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎（Live Transcribe Speech Engine），它旨在将语音或对话实时转录为文字，还能够为听障人士提供帮助。

Live Transcribe 是谷歌于今年2月推出的一款Android应用程序，它的语音识别由谷歌最先进的Cloud Speech API提供。但是，依赖于云引入了一些复杂性，不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此，谷歌把它开源出来，希望开发人员在已有的基础上进一步构建和开发。

Cloud Speech API目前无法支持无限的音频流，团队采取了一些措施来解决这一难题，例如在达到超时之前关闭并重新启动流式传输请求，这将有效减少会话中丢失的文本量。

无限流媒体音频带来了一大挑战。在许多国家，网络数据非常昂贵，并且在互联网较差的地方，带宽可能有限。Live Transcribe Speech Engine的团队对音频编解码器进行了大量实验，并最终在不影响精度的情况下将数据使用量减少了10倍。

另外，由于是提供实时语音转录，转录出来的文本会随着语音的输入不断发生变化，降低延迟自然十分必要。该引擎能够大大降低延迟率，这都要归功于它的自定义Opus编码器。

此外，值得一提的是，Live Transcribe支持超过70种语言，并能够根据语音自动识别语种，其中也包括中文。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

编程大乐趣

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

openai 开源模型Whisper语音转文本模型下载使用

洛阳泰山的博客

05-11

1291

Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。官方地址。

实战whisper语音识别第一天，部署服务器，可远程访问，实时语音转文字（全部代码和详细部署步骤）

qq_34717531的博客

03-18

3913

Whisper是OpenAI于2022年发布的一个开源深度学习模型，专门用于语音识别任务。它能够将音频转换成文字，支持多种语言的识别，包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下（如不同的背景噪声水平、说话者的口音、语速等）都能实现高准确率的语音识别，这得益于它在训练过程中使用的大量多样化的音频数据。

参与评论您还未登录，请先登录后发表或查看评论

Google 文字转语音引擎 3.3.13.

01-09

Google 文字转语音引擎3.3.13.1635260 大小：10.9MB 更新时间：2014-12-13 来自Google的文字转语音应用，用途多样。 Google 文字转语音引擎可让应用大声读出您屏幕上的文字。例如，该引擎可用于：供 Google Play 图书“大声朗读”您喜欢的图书供 Google 翻译大声读出翻译内容，以便您听清楚字词的发音供话语提示和辅助功能应用在设备上读出语音反馈可供 Play 商店中的很多其他应用使用要在您的 android 设备上使用 Google 文字转语音引擎，请转至“设置”>“语言和输入法”>“文字转语音输出”，然后选择“Google 文字转语音引擎”作为首选引擎。支持的语言包括：英语（英国）、英语（美国）、法语、德语、意大利语、韩语、西班牙语。

谷歌语音识别功能Live Transcribe，让AI帮助语言障碍者“说话”

q6q6q的专栏

10-27

1303

原标题：谷歌语音识别功能Live Transcribe，让AI帮助语言障碍者“说话”目前，全球有4.66亿人患有残疾性听力损失。而据世界卫生组织估计，到2050年，这一数字将超过9亿（即每10人中就有1人）。听力受损使得人们很难与周围的世界沟通交流，这是人类社会中一项严峻的挑战。近年来，人工智能领域越来越多地关注残疾人，企业和技术专家致力于通过人工智能实现信息无障碍。帮助语言障碍者交流近日，在“G...

Google Live Transcribe Speech Engine 教程

最新发布

gitblog_01090的博客

08-07

818

Google Live Transcribe Speech Engine 教程 live-transcribe-speech-engineLive Transcribe is an Android application that provides real-time captioning for people who are deaf or hard of hearing. This repo...

谷歌开源Live Transcribe语音识别转文字工具

q6q6q的专栏

10-27

995

谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎，它可以将语音或对话实时转录为文字，还能够为听障人士提供帮助。Live Transcribe 是谷歌于今年2月推出的一款Android应用程序，它的语音识别由谷歌最先进的Cloud Speech API提供。但是，依赖于云引入了一些复杂性，不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此...

探秘Google的Live Transcribe Speech Engine：实时语音转录的未来

gitblog_00002的博客

03-26

878

探秘Google的Live Transcribe Speech Engine：实时语音转录的未来 live-transcribe-speech-engineLive Transcribe is an Android application that provides real-time captioning for people who are deaf or hard of hearing. ...

使用 Live Transcribe 进行实时连续转录

谷歌开发者

02-26

4891

文 / Sagar Savla，机器感知产品经理据世界卫生组织 (WHO) 估计，全球有 4.66 亿耳聋及听障人士。为了让这类人群获取全球资讯并与他人沟通，自动语音识别...

freeswitch对接google的语音识别和语音合成例子

03-28

2. **mod_google_transcribe**：此模块用于将语音数据发送到Google的语音识别服务进行处理。Google的ASR技术具有高准确度和快速响应，能实时或非实时地将音频流转化为文本。在Freeswitch中，这个模块可以用于电话...

whisper-api语音识别语音翻译高性能兼容openai接口协议的开源项目

洛阳泰山的博客

07-17

1079

使用openai的开源项目winsper语音识别开源模型封装成openai chatgpt兼容接口。

基于神经网络的语音转文字识别器

走向CTO的路上...

12-01

982

常用的神经网络模型包括循环神经网络（Recurrent Neural Networks, RNN）、长短时记忆网络（Long Short-Term Memory, LSTM）、卷积神经网络（Convolutional Neural Networks, CNN）等。基于神经网络的语音转文字识别器是一种利用神经网络模型将语音信号转换为文字的技术。文字输出：通过训练好的神经网络模型，将输入的语音信号映射为相应的文字输出，实现语音转文字的功能。百度语音识别：百度提供的自动语音识别服务，支持多种场景和语言。

Google谷歌官方文字转语音

11-26

谷歌官方文字转语音TTS引擎，可以使用TextToSpeech播放中文语音，完全离线

Google语音合成.rar

04-28

Google的语音合成引擎，文字转语音（TTS）。下载后直接安装，然后在手机的设置中找到语言与输入法中的文字转语音（TTS）输出进行设置即可使用。

Google开源Live Transcribe的语音引擎

人工智能AI技术

08-19

1441

朋友们，我是床长! 如需转载请标明出处：http://blog.csdn.net/jiangjunshow 8月18日，Google宣布开源Android语音识别转录工具Live Transcribe的语音引擎。这家公司希望这样做可以让任何开发人员为长篇对话提供字幕，减少因网络延迟、断网等问题导致的沟通障碍。源代码现在可以在GitHub上获得。这意味着无论你是出国或是与新朋友见面...

Android离线文字转语音(TTS)原生实现

热门推荐

booyoung的博客

03-15

1万+

目前文字转语音用的最多的是第三方服务科大讯飞，不过需要收费。google也有离线文字转语音sdk，支持中文，发音也很好，使用免费的它不香吗？下边介绍具体使用步骤：一、下载并设置Google文字转语音引擎首先下载Google文字转语音引擎并安装。安装完成后在设置–>辅助功能–>无障碍–>文字转语音输出中将Google 文字转语音引擎设置为默认语音引擎。点击Google语音引擎设置，在引擎设置页面联网安装所需要的语音数据包。二、文字转语音编码实现代码比较简单，就不讲解了，有需要的

安卓利用谷歌文字转语音引擎实现离线文字播报语音

github_37217206的博客

09-03

4762

Text To Speech即TTS技术原生Android系统自带了一个Pico TTS引擎，但不支持中文;市面上离线的文字转语音,某讯,某度都是收费的,并且还设计到版权的问题, 实际上谷歌内置TextToSpeach类帮助开发者实现这一功能, 市场上的手机很多已经内置了文字转语音的引擎, 如果没有则安装一个apk即可,切换一下, 如下图所示: 点击Google文字转语音引擎设置, 下载中文的安装包; 即可以在代码中进行语音播报, package hz.hzhztech.publiclib..

chrome文字转语音（tts）

黄彪博客

03-24

7440

文章目录一、文章参考二、TTS (Text-To-Speech) 是文本转语音2.1 概念2.2 windows 操作系统2.3 验证是否有Windows TTS（语音转文本）三、chrome 文字转语音3.1 Web Speech相关的API实际上有两类3.2 语音合成Speech Synthesis API3.2.1 SpeechSynthesisUtterance对象，主要用来构建语音合成实例3.2.1.1 属性3.2.1.2 回调函数3.2.2 speechSynthesis对象，主要作用是触发行为

怎么实现语音识别并转化为文字

03-26

要实现语音识别并将其转化为文字，需要以下步骤： ...目前市面上已有一些成熟的语音识别引擎，例如 Google Cloud Speech-to-Text、Amazon Transcribe、百度语音识别等，可以方便地实现语音识别并将其转化为文字。