语音识别ASR与TTS
文章平均质量分 83
人工智能领域知识的普及
常生果
爱好编程,喜欢创造!
展开
-
WAV文件改变采样率(java版)
采样频率(Sampling Frequency),也称为采样速度或采样率,是指每秒钟从连续信号中提取并组成离散信号的采样数量,用赫兹(Hz)来表示。简单来说,采样频率描述了计算机每秒钟采集多少个声音样本。这一参数对声音文件的音质和音调有直接影响,并且是衡量声卡和声音文件质量的重要标准。采样频率的倒数叫做采样周期或采样时间,表示的是两个连续采样之间的时间间隔。例如,如果采样频率为 44.1 kHz(即每秒钟采集 44,100 个样本),那么采样周期就是约 22.7 微秒。原创 2024-09-16 13:48:55 · 786 阅读 · 0 评论 -
WAV裸流文件增加Header(java版)
在Windows环境下,大部分多媒体文件都是按照资源互换文件格式(Resources lnterchange File Format)存放信息,简称RIFF格式。构成RIFF文件的基本单位称之为块(chunk),每个RIFF文档是由若干个块构成。每个块(chunk)由块标识、块长度及数据等三部分所组成。原创 2024-09-16 10:44:15 · 957 阅读 · 0 评论 -
Wav的Header读取(Java版)
计算机广泛配置的16位声卡,使用的采样频率通常包括11025Hz、22050Hz、44100Hz和48000Hz四种,其中,采用11025Hz采样的声音效果相当于电话声音的效果;声道数:有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的声卡也将单声道信息处理成两个喇叭同时输出),立体声的WAV可以使两个喇叭都发声(一般左右声道有分工),这样更能感受到音频信息的空间效果。WAV文件采用的是RIFF格式结构,至少是由3个块构成,分别是RIFFChunk、fmt Chunk和Data Chunk。原创 2024-09-16 09:01:40 · 1099 阅读 · 0 评论 -
PaddlePaddle更改缓存位置(windows版本)
PaddleSpeach默认安装后,本地虽然有模型的运行相关环境,但是没有实际模型数据,这时系统会根据命令行查找相关模型,如果不存在就会去网上同步下载。这样随着模型的增多,空间占用越来越多,严重影响机器运行,急需更改模型缓存目录,根据官方文档,只需设置相应的变量环境即可。配置完成后,需要重启相关语音识别系统,配置才生效,这样相关模块的就下载到了对应的目录。首先配置一个公共的Paddle_home作为根,其他相关模块引用该根模块。原创 2024-09-12 16:05:18 · 688 阅读 · 0 评论 -
Java 把mp3文件转为wav格式文件
第四步: 写入WAV文件头。步骤 描述。第一步: 加载MP3文件。第二步: 创建音频输入流。第三步: 创建音频输出流。第六步: 关闭输入输出流。第五步: 写入音频数据。原创 2024-09-12 10:57:37 · 191 阅读 · 0 评论 -
PaddleSpeech目前不支持在AMD GPU上进行训练
此外,尽管PaddlePaddle支持NVIDIA显卡的CUDA驱动和AMD显卡的ROCm架构,但官方明确表示不支持使用AMD显卡进行训练,建议使用NVIDIA显卡进行训练。因此,对于需要GPU加速的训练任务,如果用户拥有AMD显卡,可能需要考虑使用其他支持AMD GPU的训练框架,或者使用云服务等方式来解决GPU训练的问题。此外,虽然PaddlePaddle支持AMD显卡的推理部署,但这主要是通过源码编译的方式实现的,且对于普通用户来说,自行编译源码可能存在一定的技术难度。(显卡是由GPU、显存等组成)原创 2024-09-11 09:24:02 · 838 阅读 · 0 评论 -
PaddleSpeech TTS API与流式速度对比(windows Java版)
PaddleSpeech语音识别系统,API模式和流式模式的相应时间的对比,希望对大家有所帮助!原创 2024-09-10 18:52:04 · 1059 阅读 · 0 评论 -
FreeSwitch之TTS 对接paddlespeech (windowsJava版)
本来计划FreeSwitch 通过tts_commandline对接第三方语音合成,但是由于在家安装的是windows版本,系统安装后mod缺少commandline模版,所以导致无法使用该模版。系统自带的TTS引起filter效果非常差,且不支持中文语音合成,导致在测试的过程中很多工作进行不下去。家里的电脑是windows10操作系统,安装的也是windows版本的FreeSwitch v1.11.2版本。第三步:代理模块请求语音服务器获得音频流,存储到FS指定的位置。监听FS发送过来的指令。原创 2024-09-10 16:45:07 · 351 阅读 · 0 评论 -
PaddleSpeech 本地部署+启用流式服务
关于如何Windows本地搭建:PaddleSpeech 的window环境搭建搭建完成后,只要使用PaddleSpeech的命令行或python模式进行执行,但是如果要想通过API或Stream模式,还需要单独启动相关web/流式服务即可,关于流式的相关参考资料安装完成后,进入相关目录可以看到Server相关信息: 通过以上我们可以看到安装目录下缺少conf配置文件,关于配置文件我们需要去下载相关源码,然后再Demo文件中存在相关配置:说明:语音合成-onnx模型速度比较快启动流式 ASR 服务:原创 2024-09-10 13:32:43 · 1049 阅读 · 0 评论 -
Java实现音频流录制或保存wav格式到本地
在Java中处理音频数据并保存到本地文件是一项常见的需求。你可以使用Java标准库中的包来完成这项任务。下面是一个详细的指南,介绍如何录制音频并将其保存为WAV文件。原创 2024-09-10 12:10:27 · 1093 阅读 · 0 评论 -
Python语言-NLTK库
NLTK(Natural Language Toolkit)是一个用于自然语言处理(NLP)的Python库,它为语言数据的处理、分析和建模提供了丰富的工具和资源。NLTK广泛应用于学术研究、工业界以及教育领域。以下是对NLTK的详细介绍,包括安装方法、主要特性、基本和高级功能,以及实际应用场景。Github地址:https://github.com/nltk/nltk。原创 2024-09-09 08:53:24 · 1007 阅读 · 0 评论 -
paddlespeech使用离线模型
如果出现找不到bpe_bpe_11297模型的bug,则需要在model.yaml中修改参数spm_model_prefix为这个文件所在的相对路径。当第一次安装好paddlespeech时候,开始使用时候后,因为模型不存在,所以会等一段时间从互联网上下载到本地。进入目录可获取对应的模型压缩包,放在你想要的位置进行解压。这说明本地不存在相对应的模型,程序从互联网上下载。这两个参数必须填写,否则还是会使用下载地址的模型。原创 2024-09-09 07:35:04 · 384 阅读 · 0 评论 -
PaddleSpeech 的window环境搭建
PaddleSpeech是百度飞桨(PaddlePaddle)深度学习平台下的一个语音服务工具包,它提供了一系列功能,包括语音识别、语音翻译、语音合成等。例如PaddleNLPPaddleSpeech基于飞桨的语音方向模型库,支持大量基于深度学习前沿和有影响力的模型,为开发者提供了便捷、高效的语音处理解决方案。PaddleSpeech特别关注于解决实际应用中的挑战,例如中英文混合语音识别。原创 2024-09-08 23:24:17 · 1218 阅读 · 0 评论 -
计算机CUDA介绍
跑深度学习需要用到GPU,而CUDA就是GPU和程序(如python)之间的桥梁。CUDA的环境依赖错综复杂,环境配置成为深度学习初学者的拦路虎。同时网上教程大多为解决某个具体环境配置报错,或者分别讲解CUDA、CUDAtoolkit(CUDA工具包)、CUDNN、NVCC等概念,并没有从计算机体系结构的角度将其层次化。故做此文,旨在帮助深度学习入门者从宏观上建立一个CUDA体系,而不是仅仅停留在报错才去了解的摸黑阶段。本文尽可能采用自顶向下的金字塔式讲解,使得文章抓住主干,逻辑层次清晰。转载 2024-09-08 13:27:30 · 265 阅读 · 0 评论 -
移动应用中的AR开发,5款最受欢迎工具推荐!
关于增强现实的概念,相信大家早已耳熟能详,且之前也有多篇文章专门介绍了比较火的AR应用,这从另一方面也反映出了AR技术开始普及的趋势。所以,在这里,我们介绍5款最受欢迎的用于移动应用中增强现实开发的工具。还记得前段时间在网上很火的3D小熊不?托它的福,为相当一部分人科普了增强现实(AR)这一技术。为了响应潮流,这里推荐用于移动应用中增强现实开发的5款工具。以下这张图表,转载 2016-04-12 13:50:19 · 1481 阅读 · 0 评论 -
智能科普:VR、AR、MR的区别
近日, 获得谷歌5亿美元融资的技术公司Magic Leap在WSJD展会中放出了一段实录视频,引起不小骚动。如今,也有媒体称他们为MR公司,那么VR、AR、MR之间到底有什么区别呢。VR、AR、MR定义:什么是虚拟现实?虚拟现实(Virtual Reality,简称VR,又译作灵境、幻真)是近年来出现的高新技术,也称灵境技术或人工环境。虚拟现实是利用电脑模拟产生一个三维空间转载 2016-04-12 13:35:17 · 943 阅读 · 0 评论