Artificial Intelligence~语音识别
文章平均质量分 57
语音分隔、语音识别相关知识
天狼啸月1990
舟遥遥以轻飏,风飘飘而吹衣。
展开
-
python---webRTC~vad静音检测-学习笔记
参考:https://blog.csdn.net/u012123989/article/details/72771667webRTC~vad1. mode0 ---- quality mode 1 ---- low bitrate mode 2 ---- aggressive mode 3 ---- very aggressive mode2. webRTC~vad只支持10...原创 2019-01-24 11:04:14 · 5606 阅读 · 0 评论 -
小波变换学习~语音端点检测
参考:现代语音信号处理,p97 Precise detection of speech endpoints dynamically: A wavlet convolution based approach, 20181. 小波变换,是一种时频分析方法,具有多分辨率的特点,在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方...原创 2019-01-24 11:05:32 · 604 阅读 · 0 评论 -
语音转写平台-非实时语音分割
1. question1:非实时音频切割出许多空白音频(len(audio) =0 ) analysis:audiosegment.length=14533 audiosegment.get_arrays_from_samples.length = 116267 根据audiosegment.arrays长度切割audiosegment对象,因为长度不一致,...原创 2019-01-24 10:58:13 · 1108 阅读 · 0 评论 -
基于能量或过零率的实时语音分割--学习笔记
重要假设/基础:采集到的音频在起始处有一小段静音,长度为几百毫秒,这是我们估计静音阈值E0的基础,也是语音降噪的基础。1. 能量energy 选区一定数量的音频帧,计算其平均能量值,然后加上一个经验值或乘以一个大于1的系数,由此得到E0。 javascript在浏览器源码页面--console模块下--输出console.log(); 取绝对值:Math.abs()...原创 2019-01-24 10:57:08 · 613 阅读 · 0 评论 -
web浏览器录音:web audio api
参考:https://developer.mozilla.org/zh-CN/docs/Web/API/AudioContext/createScriptProcessor https://developer.mozilla.org/en-US/docs/Web/API/Web_Audio_API/Using_Web_Audio_API1. 在录音采样过程中 采样数 = sample...原创 2019-01-24 10:55:56 · 1163 阅读 · 0 评论 -
语音识别(一):特征抽取~1.1 抽样(sampling)和量化(quantization)
1. 采样(sampling):一个信号通过度量它在特定时刻的振幅来进行抽样。 采样的目的是还原出声音的波形。在足够密集的采样频率下,人声的每个波形都能有多于两个的采样,这样的采样记录下说话人声音的频率和振幅(amplitude)。 在高频声音波形下,每个波形可能只有2-3个采样;而在低频声音波形下,每个波形可能有5-6个采样,每个采样宽度范围设定好,如paInt16。这样就可以在采样...原创 2018-08-24 11:18:34 · 1179 阅读 · 0 评论 -
Adobe Auditon使用功能(一):将音频文件切分成多段,并将每段音频分别保存到不同的文件中
Adobe Audition包含:波形模式和多轨模式(1) 波形模式delete,删除 左键选中任何一段波形,导入多轨混音(2) 多轨模式T,时间选区工具 V,移动工具 R,选择素材剃刀工具 Y,滑动工具 导出——多轨缩混(注意缩混选项)(3) target:将一段音频分割成多段,并将每段音频保存到不同文件中在波形模式下,做好范围标记。按F8或M在当前时间创建标记,在...原创 2018-08-24 11:18:24 · 10226 阅读 · 3 评论