我做了一个全语种语音识别和翻译AI工具

1 篇文章 0 订阅
1 篇文章 0 订阅
本文作者分享了自己出于对AI技术的热爱,如何利用开源项目构建一个能进行全语种识别和翻译的系统,对比了商业翻译工具的局限性,并计划扩展到语音识别嵌入视频和实时语音识别,目标是通过AI提升个人和社区的能力。
摘要由CSDN通过智能技术生成

视频链接:https://www.bilibili.com/video/BV1Ar42187v4/


学英语不如学AI,用AI就能做到全语种的识别和翻译



事情的起因是我用百度翻译翻译语音的时候,居然只支持中英互翻?其他语种的居然要收费,而且电脑端都不支持语音翻译,这什么同声翻译也是昂贵。



a502049fed6d5c3f7f96c18f9cfab77e.jpeg

8e12e07185f2c917c0ccdf19106e3426.jpeg









这让我一个AI出身的人直接坐不住了,明明网上有这么多的开源项目,为什么无法提供全面的服务,于是我打算自己做一些能够满足我需求的项目。




首先我们来看一下英中互翻,我输入了一个“hello,my name is LiHua“,他很快的就输出了“你好,我叫李华”。


1a2eeb81e999613f2efb82f894b59e25.jpeg






那中文翻译成英文的效果怎么样呢,我说我现在好饿,我想吃麦当劳,诶就可以翻译到英文去。


b415129e8ac1b709d6ebcd2a9ee17dfd.jpeg




当然这些功能在有道词典或者百度翻译谷歌翻译就可以做到。 但是他们的语音识别居然要收费,这是我无法接受的,我要自己实现。


我参考了faster-whisper搭了一个语音识别的功能,让我们来试试派大星的语音识别,语音识别的还是很不错的吧,当然这翻译的符号有一点点问题。


91ccaf5cbb1775011d8f70e2538e654c.jpeg






那再试一试翻译成其他语言的效果怎么样吧,好,结果出来了,因为我不懂日文,到有道看看效果怎么样,诶效果还是很好的吧。


f42b46ab0d7363869e760ab8d2a6c4e8.jpeg





我这还测了几个小语种的翻译,都还是很好的吧,比如这个白俄罗斯语。

ec80ad84d26e66959c7c8b601a50d038.jpeg






最后试了下德语的希特勒发火经典桥段,即使是一个四分钟的音频也能很好的识别。


4484a9156d7c064273a0a4e318ec7534.jpeg






接下来,我可能想做一下把语音识别自动嵌入到视频中,以及实时的语音识别吧,有别的什么想实现的可以在后台与我交流,让我们一起用AI提升我们的能力吧。


赛博AI


基于AI和数字化,开发增强人类语音、知识、视觉,决策能力的产品,实现近赛博改造。
合作联系:cyberpunk_010
邮箱:ai_cybertrans@163.com

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值