- 博客(6)
- 资源 (20)
- 收藏
- 关注
原创 麦克风阵列设计
CSND已永久停更,最新版唯一来源点击下面链接跳转:语音增强和语音识别网页书语音识别准确率反映在ASR上,ASR准确率一方面依赖于语音训练集和训练模型,另一方面依赖于语音信号获取的质量。这里主要讨论获取到的语音质量对ASR的影响。以此来指导麦克风阵列的设计。这里列摘抄一句话,原文的大意是说,信噪比(SNR)每提高4~5dB,则语音系统的准确率将获得50%的提高,,即人声信号功率除以噪声...
2016-09-24 21:07:40 20962 5
原创 蓝牙之十四 HFP profile
Profile依赖图中绘出了蓝牙profile结构和其依赖,profile之间可以存在依赖关系。根据图1可以知道Hands-Free Profile依赖于Serial Port Profile和Generic Access Profile。图1.1 蓝牙profileHFP协议栈 基带,LMP以及L2CAP是蓝牙OSI协议的第一和第二层。RFCOMM是蓝牙的模拟串口
2016-09-20 20:25:27 10056
原创 WebRTC之noise suppression算法
CSND已永久停更,最新版唯一来源点击下面链接跳转:语音增强和语音识别网页书WebRTC噪声抑制核心算法在ns_core.c文件里。噪声频谱可以使用如语音/噪声似然函数进行估计。将接收到的每帧信号和频率分量分类为噪声或语音。算法原理该算法的核心思想是采用维纳滤波器抑制估计出来的噪声。上式中x和n分别表示语音和噪声,而y表示麦克风采集到的信号。它们的频谱关系如上,...
2016-09-20 12:39:01 33147 24
原创 android调试用到的各种命令
命令行切换横竖屏在无触屏或者无重力传感器时无法横竖屏看视频时,可以使用如下的方式切换横竖屏。//关闭自动旋转gsc@gsc-250:~$ adb shell content insert --uri content://settings/system --bind name:s:accelerometer_rotation --bind value:i:0//横屏观看gsc
2016-09-20 12:38:32 1836
原创 WebRTC之beamforming算法
CSND已永久停更,最新版唯一来源点击下面链接跳转:语音增强和语音识别网页书坐标问题这里以笔记本为例进行说明,当笔记本按如下方式打开:首先是键盘和液晶屏呈90度,然后鼠标上方,也就是液晶屏上方正中间是camera,把平行于键盘的面看成是xy平面,把液晶屏所在的面看成是xz平面,所有平面的原点都在Camera的位置。方位角:从原点开始,Camera的右侧是0度,逆时针方...
2016-09-01 20:27:30 16980 34
原创 WebRTC之VAD算法
CSND已永久停更,最新版唯一来源点击下面链接跳转:语音增强和语音识别网页书VAD(Voice Activity Detection)算法的作用是检测语音,在远场语音交互场景中,VAD面临着两个难题:1. 可以成功检测到最低能量的语音(灵敏度)。2. 如何在多噪环境下成功检测(漏检率和虚检率)。漏检反应的是原本是语音但是没有检测出来,而虚检率反应的是不是语音信号而被检测...
2016-09-01 14:40:04 52071 28
深度学习 模型调优 keras mnist
2022-06-06
bluetooth BLE server
2016-12-12
vim 技巧和插件
2015-05-08
linux tcp/ip协议栈
2015-04-22
Linux系统启动那些事—基于Linux 3.10内核
2014-10-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人